banner
Новини Технології 21.01.2025 comment views icon

DeepSeek запустила «думаючу» ШІ-модель R1 — як o1 від OpenAI, але безплатно

author avatar

Катерина Даньшина

Редактор новин

DeepSeek запустила «думаючу» ШІ-модель R1 — як o1 від OpenAI, але безплатно
Кадр з фільму «Я, робот» / 20th Century Fox

Китайська лабораторія штучного інтелекту DeepSeek випустила модель міркування R1, яка продублювала, а то й перевершила результати o1 від OpenAI в деяких тестах.

З плюсів — DeepSeek R1 доступна безплатно із лімітом до 50 повідомлень на день. Після реєстрації чи авторизації потрібно обрати опцію «DeepThink».

За даними DeepSeek, R1 перевершує o1 у тестах AIME, MATH-500 і SWE-bench Verified (перший порівнює модель з іншими для оцінки ефективності, другий є збіркою текстових задач, а третій зосереджується на завданнях програмування).

DeepSeek запустила «думаючу» ШІ-модель R1
Тести R1 / DeepSeek

Моделі міркування вирізняються тим, що можуть ефективно перевіряти факти й уникати деяких «пасток», на яких зазвичай «гальмують» звичайні моделі, а також показувати надійніші результати у природничих науках, фізичних та математичних задачах. Водночас, у порівнянні зі стандартними, моделям міркуванням необхідно трохи більше часу для пошуку рішення.

DeepSeek R1 містить 671 млрд параметрів, утім доступні й «простіші» версії, які мають від 1,5 млрд до 79 млрд параметрів — при цьому найменша може працювати й на ПК, тоді як для потужніших версій знадобиться сильне обладнання (утім і воно доступне через API DeepSeek за ціною на 90% нижчою, ніж OpenAI o1).

Зважаючи, що DeepSeek R1 — це китайська модель, тут є й певні мінуси. Її робота має бути схвалена китайським регулятором, який повинен переконатися, що відповіді моделі «втілюють основні соціалістичні цінності» (тобто R1 не відповідатиме на питання про площу Тяньаньмень чи автономію Тайваню).

Цікаво, що одна з попередніх ШІ-моделей DeepSeek так само перевершувала багатьох конкурентів за популярними тестами (зокрема в програмуванні й написанні есе), однак мала цікавішу особливість — вважала, що вона ChatGPT (ймовірно, через те, що навчалась на даних американської конкурентки).

Нова модель ChatGPT o1 «плела інтриги проти людей» і заважала себе вимкнути під час контрольних тестів, — Apollo Research

Джерело: TechCrunch

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: