¿Qué pasó?
Un error en una actualización de software de CrowdStrike provocó una interrupción masiva a nivel global que afectó a millones de dispositivos Windows. El fallo generó la temida «pantalla azul de la muerte», bloqueando equipos y causando estragos en diversos sectores, incluyendo:
- Transporte: Se retrasaron vuelos internacionales y se interrumpieron las conexiones de transporte público.
- Salud: Los sistemas de hospitales se vieron afectados, obligando a cancelar operaciones no urgentes.
- Finanzas: Las operaciones bancarias y de pago se vieron ralentizadas o interrumpidas.
- Empresas: Innumerables empresas de todo tipo experimentaron fallos en sus sistemas informáticos.
En el mundo de las TI, los errores lógicos son bien conocidos por causar “bucles infinitos” que provocan el consumo continuo de recursos de la CPU y conducen a un bloqueo del sistema, también conocido como “pantalla azul de la muerte”.
Desde el primer momento se dijo que los servidores Mac y Linux no se habían visto afectados y que no se trataba de un incidente de seguridad ni de un ciberataque.
¿Cómo sucedió?
El problema se originó en una actualización del software antivirus Falcon de CrowdStrike, diseñado para proteger los sistemas Windows. La actualización contenía un error que, al instalarse, provocaba un fallo crítico en el sistema operativo.
Desde CrowdStrike han asegurado que dichas actualizaciones “son una parte normal del funcionamiento del sensor y se producen varias veces al día en respuesta a tácticas, técnicas y procedimientos novedosos descubiertos por CrowdStrike”, al tiempo que recuerdan que no se trata de un proceso nuevo y que “la arquitectura ha estado en funcionamiento desde el inicio de Falcon”.
¿Cuándo ocurrió?
El incidente comenzó el viernes 19 de julio de 2024 alrededor de las 7:00 AM (hora UTC) y afectó a usuarios de todo el mundo durante varias horas. Los sistemas comenzaron a restablecerse gradualmente a lo largo del sábado 20 de julio.
¿Cuántos se vieron afectados?
Microsoft estima que el fallo afectó a 8,5 millones de dispositivos Windows en todo el mundo, que es menos del uno por ciento de todas las máquinas Windows. Microsoft ha puesto en marcha a cientos de sus ingenieros y expertos para trabajar directamente con los clientes para restaurar los servicios.
La magnitud del incidente lo ha convertido en uno de los mayores apagones informáticos de la historia.
¿Por qué ocurrió?
La causa principal del incidente fue un error humano en el desarrollo de la actualización de CrowdStrike. La empresa ha reconocido el fallo y se ha disculpado por las molestias causadas.
La raíz del problema fue una actualización de configuración de sensor de rutina enviada a los sistemas Windows el 19 de julio de 2024 a las 04:09 UTC, que desencadenó un error lógico que puso en pantalla azul los sistemas informáticos críticos en todo el mundo.
Microsoft ha lanzado una herramienta para ayudar a los administradores de TI a acelerar el proceso de reparación de los clientes y servidores de Windows afectados por el problema. Para utilizar la herramienta, los usuarios deben tener un cliente de Windows de 64 bits con al menos 8 GB de espacio libre desde el que se pueda ejecutar la herramienta para crear la unidad USB de arranque, junto con privilegios administrativos en el cliente de Windows.
Consecuencias e impacto
El incidente ha tenido un impacto significativo en las empresas y usuarios afectados, generando pérdidas económicas, retrasos y frustración. Además, ha puesto de relieve la necesidad de contar con procesos de control de calidad rigurosos para prevenir este tipo de errores.
Tanto CrowdStrike como Microsoft han visto empañada su imagen por el incidente, y no se descarta que las empresas y usuarios afectados presenten demandas legales contra CrowdStrike y Microsoft por las pérdidas sufridas.
El incidente, además podría impulsar cambios en la forma en que se desarrollan, implementan y gestionan las soluciones de seguridad.
Respuesta ante el incidente
CrowdStrike ha emitido una actualización para corregir el error y ha implementado medidas para evitar que este tipo de fallos vuelvan a ocurrir.
Microsoft ha recomendado a sus usuarios desinstalar la actualización defectuosa y ha instado a CrowdStrike a mejorar sus procesos de desarrollo y pruebas.
Y los expertos en ciberseguridad han hecho hincapié en la importancia de mantener los sistemas actualizados y contar con soluciones de seguridad confiables para protegerse contra este tipo de amenazas.
El incidente de CrowdStrike y Microsoft sirve como un recordatorio de la fragilidad de los sistemas informáticos y la necesidad de una colaboración constante entre empresas, usuarios y expertos para garantizar la seguridad en el mundo digital.