En un momento en que proteger el software es más urgente que nunca, un equipo de investigadores europeos ha desarrollado un modelo de inteligencia artificial que podría cambiar las reglas del juego en la detección de vulnerabilidades. Se llama White-Basilisk y ya está dando que hablar por su capacidad para analizar bases de código completas con gran precisión… y sin necesidad de grandes infraestructuras. Lo más llamativo: lo consigue con un diseño ligero y altamente eficiente.
Mucho análisis con pocos recursos
Mientras que los grandes modelos de IA actuales (como los LLMs) requieren billones de parámetros y gran potencia computacional, White-Basilisk funciona con solo 200 millones de parámetros, según explican los investigadores en un documento. Y lo sorprendente es que supera en precisión a modelos más de 30 veces mayores en tareas de detección de vulnerabilidades, según recoge el PDF publicado en arXiv.
¿Cómo lo consigue? Gracias a una arquitectura híbrida y muy optimizada que permite analizar grandes volúmenes de código —hasta 128.000 tokens por secuencia— sin necesidad de fraccionarlo. Esto le da una ventaja clave: detectar fallos que no están aislados, sino repartidos en distintas partes del programa, algo habitual en el software real.
Pensado para entornos reales
Uno de los grandes logros de White-Basilisk es que se adapta a los escenarios cotidianos de los equipos de desarrollo y ciberseguridad. Puede integrarse como una extensión de Visual Studio Code, funcionar dentro de procesos de integración continua (CI/CD) o incluso ejecutarse en entornos cerrados como sistemas IoT o infraestructuras críticas sin conexión a la nube.
El modelo ha sido entrenado específicamente para trabajar con código en C y C++, dos lenguajes todavía muy presentes en proyectos industriales, dispositivos y sistemas embebidos. Aunque por ahora está especializado en ese entorno, sus creadores ya trabajan en extender su compatibilidad.
Rendimiento con conciencia ambiental
Además de sus resultados técnicos, White-Basilisk destaca por su bajo consumo energético. El entrenamiento del modelo generó solo 85 kilos de CO₂, frente a las toneladas que emiten otros modelos populares del sector. Esta eficiencia permite utilizarlo en organizaciones sin grandes presupuestos en cloud o supercomputación, democratizando el uso de la IA en seguridad.
Con White-Basilisk, los investigadores demuestran que no siempre se necesita el modelo más grande para lograr los mejores resultados. A través de un diseño cuidadoso, centrado en necesidades reales, han conseguido una herramienta que podría convertirse en un gran aliado para los profesionales de la ciberseguridad que luchan contra las vulnerabilidades día a día.