ИИ будет диагностировать болезни, которыми вы заболеете через 20 лет

Опубликовал Олександр Федоткін

Немецкие ученые из Центра онкологических исследований в Гейдельберге создали новый инструмент на базе ИИ, способный прогнозировать риск развития более 1 тыс. заболеваний. 

Отмечается, что в некоторых случаях модель Delphi-2M может предоставлять прогноз на десятилетия вперед. Она использует данные из медицинских карт и факторы образа жизни человека для оценки вероятности развития таких болезней, как онкозаболевания, заболевания кожи и нарушения иммунитета, за 20 лет до появления первых характерных проявлений.

Эта модель обучалась только на одном наборе данных в Великобритании, однако ее способность моделировать вероятность многих заболеваний может помочь врачам выявлять людей из групп высокого риска и заблаговременно принимать необходимые профилактические меры. Как отмечает один из разработчиков Delphi-2M, специалист по информатике из Мюнхенского университета Людвига-Максимилиана Стефан Фейерригель, способность этой модели прогнозировать несколько заболеваний одновременно действительно впечатляет. 

Большинство существующих инструментов медицинской диагностики и прогнозирования на базе ИИ способны предсказывать риск развития лишь какого-то одного заболевания. В рамках создания более универсальной модели специалист по анализу данных Мориц Герстунг и его коллеги усовершенствовали Большую языковую модель (LLM), которая называется генеративным предобученным трансформатором (GPT) и лежит в основе популярных чат-ботов, в частности, ChatGPT. 

Отвечая на вопросы, модели типа GPT выдают результаты, которые в соответствии с их обучением на больших объемах данных, статистически наиболее вероятны. Авторы исследования создали модифицированную модель, которая позволяет прогнозировать у человека риск развития 1 тыс 258 заболеваний на основе его анамнеза. Delphi-2M учитывает возраст, пол, индекс массы тела, вредные привычки. Она была обучена на данных 400 тыс. граждан Великобритании, взятых из национального Биобанка. 

Прогнозируемые показатели для девяти примерных диагнозов и смерти (ось Y) как функция возраста (ось X). Точки показывают прогнозы каждого записанного входного токена. Цвета разделяют биологический пол; более темные цвета указывают прогнозы непосредственно перед рассматриваемым диагнозом. Фиолетовая и бирюзовая линии являются показателями заболеваемости, наблюдаемыми для каждого годового возрастного интервала в учебных данных. Сплошная черная линия объединяет последовательные прогнозы для одного случайно выбранного случая в течение возраста/Nature

Для большинства заболеваний прогнозы Delphi-2M совпадали или превосходили точность других современных моделей, оценивающих риск развития того или иного заболевания. Эта модель продемонстрировала лучшие результаты, чем стандартный алгоритм машинного обучения, который использует биомаркеры — уровни определенных молекул или соединений в организме, для прогнозирования риска развития нескольких заболеваний. 

Наиболее эффективно Delphi-2M предсказывала риск развития нескольких видов онкозаболеваний. Модель рассчитывала возможность развития каждого заболевания у человека в течение периода до двух десятилетий, в зависимости от информации, содержащейся в его медицинской карте.

Мориц Герстунг и его коллеги протестировали Delphi-2M на данных о состоянии здоровья 1,9 млн человек из Датского национального реестра пациентов — национальной базы данных, которая отслеживает госпитализации почти полвека. Они установили, что прогнозы модели для пациентов из реестра были лишь немного менее точными, чем для участников британского Биобанка. 

По словам Морица Герстунга, это свидетельствует о том, что Delphi-2M может делать более или менее надежные прогнозы в случае применения к данным из национальных систем здравоохранения, отличных от тех, на которых она обучалась. Теперь Герстунг и его коллеги планируют оценить точность Delphi-2M на наборах данных из нескольких стран, чтобы расширить сферу ее применения.

Результаты исследования опубликованы в журнале Nature

Источник: Nature

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.