Блоги
«Генетики 0 — 1 Excel». Несколько десятков человеческих генов пришлось переименовать, чтобы табличный процессор Microsoft перестал путать их названия с датами

«Генетики 0 — 1 Excel». Несколько десятков человеческих генов пришлось переименовать, чтобы табличный процессор Microsoft перестал путать их названия с датами

«Генетики 0 — 1 Excel». Несколько десятков человеческих генов пришлось переименовать, чтобы табличный процессор Microsoft перестал путать их названия с датами


На самом деле связь между популярным табличным процессором Microsoft Excel и генетикой  не такая уж и неожиданная, как может показаться на первый взгляд.

Геном человека содержит 20—25 тыс. активных генов: микроскопических цепочек ДНК и РНК, чья совокупность все определяет, делая каждого из нас уникальным. Каждому гену присваивается уникальное имя и буквенно-цифровой индекс, известный как символ, который ученые используют в своих работах. Однако за последний год генетикам пришлось переименовать 27 генов из-за того, что инструмент Microsoft неправильно интерпретирует эти символы в качестве даты. За последний год или около того комитет по номенклатуре генов (HUGO Gene Nomenclature Committee — это подразделение Международной организации по изучению генома человека, присваивающее уникальные имена для всех известных человеческих генов) выпустил рекомендации по переименованию 27 генов. И все из-за Microsoft Excel.

Дело в том, что редактор для работы с электронными таблицами, который пользуется большой популярностью и среди ученых, или, говоря точнее, функция автоформатирования ошибочно интерпретировала названия этих генов как даты. Из-за этого в научных работах нередко возникали ошибки. Например, название «MARCH1» (Membrane Associated Ring-CH-Type Finger 1) система автоматически исправляла на «1-Mar» (1 марта). Ниже приведена «гифка», которая наглядно демонстрирует явление.

«Генетики 0 — 1 Excel». Несколько десятков человеческих генов пришлось переименовать, чтобы табличный процессор Microsoft перестал путать их названия с датами

И случаются такие казусы довольно-таки часто. Согласно одному исследованию 2016 года, система автокоррекции Excel наследила в каждой пятой из 3597 работ, опубликованных в рецензируемых научных журналах.

Скажете автоматическое форматирование в Excel можно отключить или вручную задать корректный тип данных в отдельных столбцах? Можно, вот только проблему это полностью не решает: когда файл откроет другой человек на другом ПК, у которого функция автоформатирования по умолчанию включена, данные автоматически преобразятся. И отказаться от Excel для генетиков тоже не вариант — они повсеместно используют этот инструмент в своей деятельности, в том числе при проведении клинических испытаний. И поскольку внесения изменений со стороны Microsoft они не дождались, пришлось переименовать гены, которые система ошибочно распознавала как даты. Так, например, тот же MARCH1 стал MARCHF1, а SEPT1 — SEPTIN1.

Источник: The Verge


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: