Exabeam ha presentado Agent Behavior Verification (ABV), una nueva metodología orientada a evaluar si los agentes de inteligencia artificial están correctamente configurados, autorizados y gobernados antes de entrar en producción. La iniciativa responde al creciente uso de agentes de IA con capacidad para acceder a sistemas, utilizar herramientas, ejecutar procesos y tomar decisiones de forma cada vez más autónoma.
Según la compañía, aunque ya existen mecanismos para supervisar la actividad de los agentes una vez desplegados —como el análisis de vulnerabilidades o los ejercicios de red teaming—, las organizaciones siguen teniendo dificultades para determinar si un agente está preparado para operar de forma segura antes de comenzar a trabajar en entornos reales.
Para abordar este desafío, Exabeam ha desarrollado Praxen, una herramienta de código abierto que actúa como implementación de referencia de este modelo de verificación. Su objetivo es analizar si los permisos, herramientas, integraciones y controles asignados a un agente se corresponden con las funciones para las que ha sido diseñado.
El sistema utiliza un marco denominado ABV remit, que define qué puede hacer un agente, a qué recursos puede acceder y cuáles son sus límites operativos. A partir de esta información, Praxen evalúa aspectos como la configuración, la memoria, las integraciones o el entorno de ejecución para detectar posibles discrepancias entre el comportamiento previsto y el comportamiento real.
Steve Wilson, Chief AI Officer de Exabeam y cofundador del proyecto OWASP Gen AI Security, explica que el objetivo es ofrecer a las organizaciones una forma de validar que los agentes disponen únicamente de los permisos y capacidades necesarios para desempeñar su función. En sus palabras, la cuestión fundamental es determinar si un agente “hará su trabajo y solo su trabajo”.
Además de identificar posibles riesgos de comportamiento antes del despliegue, Praxen genera recomendaciones de mejora y una puntuación sobre el nivel de madurez de la postura de seguridad del agente. La herramienta está disponible bajo licencia Apache 2.0 y puede ser utilizada y ampliada por desarrolladores, investigadores y profesionales de seguridad.
La propuesta se enmarca en una tendencia creciente del mercado orientada a reforzar la gobernanza de los agentes de IA. A medida que estos sistemas evolucionan desde asistentes hacia auténticos trabajadores digitales, fabricantes y organizaciones buscan mecanismos que permitan garantizar que sus capacidades y permisos permanecen alineados con los objetivos para los que fueron creados.
















