Рубрики Новости

Провайдер «Ланет» рассказал о причинах недавнего сбоя – вышла из строя линейная сетевая карта на 32-а 10-гигабитных порта

Опубликовал
Вадим Карпусь

Интернет-провайдер «Ланет» предоставил подробную информацию об аварийном частичном отключении сервисов, произошедшим утром 22 июня 2020 года. В частности, предоставлены сведения с таймингом и объяснением последовательности событий.

Отмечается, что 22 июня 2020 года в 9:53 на участке сети центрального ядра сети «Ланет» вышла из строя часть оборудования, что привело к аварийной ситуации, в результате которой часть абонентов наблюдала трудности в доступе к интернету. В результате аварии в 9:58 у некоторых пользователей «Ланет» начались проблемы с интернет-доступом. В 10:10 проблема распространилась и продолжалась до 11:02.

Восстановив работу сервисов и проанализировав ситуацию, провайдер отследил всю последовательность событий во время этого инцидента:

Онлайн-курс "AWS для початківців" від robot_dreams.
Навчіться працювати з cloud-native системами та побудуйте власний застосунок для зберігання даних у системі AWS.Досвід і фідбек від Fullstack Developer in Amazon.
Детальніше про курс
  • 9:53 — вышла из строя сетевая карта ядра (линейная сетевая карта на 32-а 10-гигабитных порта);
  • 9:54 — вследствие деградации трафика начались сбои в работе внутренних сервисов, в то же время специалисты зафиксировали аварийную ситуацию. Поскольку ключевая услуга по предоставлению доступа в интернет пользователям продолжала работать, на начальном этапе реагирования специалисты сосредоточились на решении проблемы без глобальных вмешательств в работу всей системы;
  • 10:10 — усиление последствий привело к сбоям в доступе к интернету у пользователей, а ситуация приобрела массовый характер;
  • 10:12 — инженеры приступили к перенастройке оборудования и частичному переносу сервисов в работающие модули сетевого ядра для возобновления предоставления основной услуги интернет-доступа. Благодаря заложенному резерву, это удалось провести оперативно на доступной конфигурации;
  • 10:35 — началось восстановление ключевых внутренних сервисов, отвечающих за предоставление доступа к сети интернет абонентам;
  • 11:02 — восстановлен доступ в интернет для абонентов;
  • 11:10 — начата перенастройка ядра сети и установка резервного модуля с целью переключения и восстановления остальных сервисов, в том числе телефонии;
  • 11:57 — установлены дополнительные элементы оборудования и возобновлена ​​работа всех внутренних сервисов.

Как отмечают в компании, услуга кабельного телевидения работала без сбоев, на неё авария никак не повлияла.

Анализируя ход событий и шаги для преодоления последствий аварии, интернет-провайдер «Ланет» отмечает, что сейчас рассматриваются варианты модификации инфраструктуры и возможности для перераспределения сетевой нагрузки для предупреждения таких ситуаций в будущем.

Источник: Lanet

Disqus Comments Loading...