
Un ingeniero de un proveedor de internet sudafricano borró accidentalmente importantes ajustes de la red mientras se apresuraba a salir a fumar un cigarrillo, lo que provocó el mayor corte de internet del continente africano en ese momento.
Hace unas décadas, uno de los principales proveedores de servicios de Internet de Sudáfrica se enfrentó a una crisis sin precedentes debido a un error aparentemente sin importancia de un empleado. El ingeniero, llamado Paton, trabajaba como «ingeniero de red troncal» — un puesto que requería gran responsabilidad y atención al detalle.
La empresa para la que trabajaba Paton desempeñaba un papel fundamental a la hora de garantizar el funcionamiento de Internet no solo en Sudáfrica, sino también en los países vecinos. Los servidores DNS del proveedor eran autoritativos para miles de dominios, incluidos los dominios nacionales de primer nivel de varios países africanos.
Un día, Paton recibió el encargo de actualizar los bloques de redUn bloque de red es una porción de espacio de direcciones IP asignada para su uso en una red o subred concreta y distribuirlos a través de BGP
BGP (Border Gateway Protocol) es el principal protocolo de enrutamiento entre sistemas autónomos de Internet que permite transferir rutas entre distintas redes a socios y proveedores de tránsito. Esto implicaba editar listas de control de acceso (ACL)
ACL (Access Control List) — una lista de control de acceso que define reglas de acceso a los recursos de red para distintos usuarios o grupos de usuarios. que regulaban el acceso de usuarios y dominios a recursos de red específicos. Paton solía hacer este trabajo a conciencia, pero esta vez sus compañeros le llamaron para salir a fumar. El deseo de unirse a ellos hizo que el ingeniero se diera prisa.
Cuando Paton regresó de la pausa, la oficina era un auténtico caos. El centro de operaciones de la red estaba inundado de llamadas de clientes enfadados. Resultó que se había producido el mayor corte de Internet del continente africano en aquel momento.
Para empeorar las cosas, un desconocido que decía ser un hacker se puso en contacto con una publicación local de tecnología y afirmó estar implicado en el incidente. La noticia se difundió rápidamente, creando problemas adicionales a la dirección de la empresa.
Una investigación reveló que no se había producido ninguna brecha de seguridad. Paton, en su precipitación, había sustituido accidentalmente todas las listas de control de acceso existentes en lugar de limitarse a añadir nuevas unidades de red. Esto provocó que dejara de funcionar un complejo sistema de encaminamiento del tráfico de Internet para gran parte del África subsahariana.
Tras el incidente, Paton no sólo restauró las ACL y actualizó los bloques de red, sino que también desarrolló el primer protocolo de gestión de cambios de la empresa — un conjunto de normas y procedimientos que rigen el proceso de realizar cambios en los sistemas informáticos para evitar incidentes o interrupciones.
Fuente: TheRegister
Spelling error report
The following text will be sent to our editors: