
Німецькі науковці з Центру онкологічних досліджень у Гейдельберзі створили новий інструмент на базі ШІ, здатний прогнозувати ризик розвитку понад 1 тис. захворювань.
Зазначається, що у деяких випадках модель Delphi-2M може надавати прогноз на десятиліття вперед. Вона використовує дані з медичних карт та фактори образу життя людини для оцінки ймовірності розвитку таких хвороб, як онкозахворювання, захворювання шкіри та порушення імунітету, за 20 років до появи перших характерних проявів.
Ця модель навчалась лише на одному наборі даних у Великій Британії, однак її здатність моделювати ймовірність багатьох захворювань може допомогти лікарям виявляти людей з груп високого ризику та завчасно вживати необхідні профілактичні заходи. Як зазначає один з розробників Delphi-2M, спеціаліст з інформатики з Мюнхенського університету Людвіга-Максіміліана Стефан Фейєррігель, здатність цієї моделі прогнозувати кілька захворювань одночасно дійсно вражає.
Більшість наявних інструментів медичної діагностики та прогнозування на базі ШІ здатні передбачати ризик розвитку лише якогось одного захворювання. У рамках створення більш універсальної моделі спеціаліст з аналізу даних Моріц Герстунг та його колеги вдосконалили Велику мовну модель (LLM), що називається генеративним переднавченим трансформатором (GPT) та лежить в основі популярних чат-ботів, зокрема, ChatGPT.
Відповідаючі на питання, моделі типу GPT видають результати, які відповідно до їхнього навчання на великих обсягах даних, статистично найбільш ймовірні. Автори дослідження створили модифіковану модель, яка дозволяє прогнозувати в людини ризик розвитку 1 тис 258 захворювань на основі її анамнезу. Delphi-2M враховує вік, стать, індекс маси тіла, шкідливі звички. Вона була навчена на даних 400 тис. громадян Великої Британії, взятих з національного Біобанку.

Для більшості захворювань прогнози Delphi-2M співпадали або перевершували точність інших сучасних моделей, які оцінювали ризик розвитку того чи іншого захворювання. Ця модель продемонструвала кращі результати за стандартний алгоритм машинного навчання, який використовує біомаркери — рівні певних молекул або сполук в організмі, для прогнозування ризику розвитку кількох захворювань.
Найбільш ефективно Delphi-2M передбачала ризик розвитку кількох видів онкозахворювань. Модель розраховувала можливість розвитку кожного захворювання в людини протягом періоду до двох десятиліть, залежно від інформації, що містилась в його медичній карті.
Моріц Герстунг та його колеги протестували Delphi-2M на даних щодо стану здоров’я 1,9 млн людей з Данського національного реєстру пацієнтів — національної бази даних, яка відстежує госпіталізації майже півстоліття. Вони встановили, що прогнози моделі для пацієнтів із реєстру були лише трохи менш точними, ніж для учасників британського Біобанку.
За словами Моріца Герстунга, це свідчить про те, що Delphi-2M може робити більш-менш надійні прогнози у разі застосування до даних з національних систем охорони здоров’я, відмінних від тих, на яких вона навчалась. Тепер Герстунг та його колеги планують оцінити точність Delphi-2M на наборах даних з кількох країн, щоб розширити сферу її застосування.
Результати дослідження опубліковані у журналі Nature
Джерело: Nature
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: