Google: ошибки в модулях памяти случаются чаще, чем считается

Некоторое время назад компания Google публиковала данные о надежности работы винчестеров в зависимости от срока их эксплуатации. Выводы сводились к тому, что если жесткий диск выходит из строя, то чаще всего это случается либо в первые месяцы работы, либо уже после очень длительного срока эксплутации. Учитывая то, какое количество накопителей приходится применять компании, можно с доверием относиться к данной статистике. На днях в Google решили поделиться информацией о работе другого компонента ПК – оперативной памяти. Как утверждают представители компании, в результате исследований стало ясно, что частота ошибок при работе с модулями памяти гораздо больше, чем считалось ранее, и подобные ошибки отнюдь не являются редкостью.

Если конкретней, то приблизительно один из трех серверов Google каждый год сталкивается с ошибкой в памяти, которая поддается коррекции благодаря наличию специальных механизмов error correction code (ECC), которые используются в модулях серверной памяти. При этом один компьютер из сотни раз в год попадает в ситуацию когда ошибка не может быть исправлена и это обычно приводит к зависанию системы.

Предыдущие данные, собранные после исследований, проведенных на 300 компьютерах, показывали, что количество ошибок в одном модуле памяти лежит в пределах от 200 до 5000 при работе в течение 1 млрд. часов. Информация от Google значительно корректирует этот показатель. По данным компании эта цифра находится в диапазоне от 25000 до 75000.