DeepSeek запустила «думаючу» ШІ-модель R1 — Кадр з фільму «Я, робот» / 20th Century Fox

Китайська лабораторія штучного інтелекту DeepSeek випустила модель міркування R1, яка продублювала, а то й перевершила результати o1 від OpenAI в деяких тестах.

З плюсів — DeepSeek R1 доступна безплатно із лімітом до 50 повідомлень на день. Після реєстрації чи авторизації потрібно обрати опцію «DeepThink».

За даними DeepSeek, R1 перевершує o1 у тестах AIME, MATH-500 і SWE-bench Verified (перший порівнює модель з іншими для оцінки ефективності, другий є збіркою текстових задач, а третій зосереджується на завданнях програмування).

Моделі міркування вирізняються тим, що можуть ефективно перевіряти факти й уникати деяких «пасток», на яких зазвичай «гальмують» звичайні моделі, а також показувати надійніші результати у природничих науках, фізичних та математичних задачах. Водночас, у порівнянні зі стандартними, моделям міркуванням необхідно трохи більше часу для пошуку рішення.

DeepSeek R1 містить 671 млрд параметрів, утім доступні й «простіші» версії, які мають від 1,5 млрд до 79 млрд параметрів — при цьому найменша може працювати й на ПК, тоді як для потужніших версій знадобиться сильне обладнання (утім і воно доступне через API DeepSeek за ціною на 90% нижчою, ніж OpenAI o1).

Зважаючи, що DeepSeek R1 — це китайська модель, тут є й певні мінуси. Її робота має бути схвалена китайським регулятором, який повинен переконатися, що відповіді моделі «втілюють основні соціалістичні цінності» (тобто R1 не відповідатиме на питання про площу Тяньаньмень чи автономію Тайваню).

Цікаво, що одна з попередніх ШІ-моделей DeepSeek так само перевершувала багатьох конкурентів за популярними тестами (зокрема в програмуванні й написанні есе), однак мала цікавішу особливість — вважала, що вона ChatGPT (ймовірно, через те, що навчалась на даних американської конкурентки).