Новини Технології 21.01.2025 о 08:26 comment views icon

DeepSeek запустила «думаючу» ШІ-модель R1 — як o1 від OpenAI, але безплатно

author avatar

Катерина Даньшина

Авторка новин

DeepSeek запустила «думаючу» ШІ-модель R1 — як o1 від OpenAI, але безплатно
Кадр з фільму «Я, робот» / 20th Century Fox
Розділ Технології виходить за підтримки

Китайська лабораторія штучного інтелекту DeepSeek випустила модель міркування R1, яка продублювала, а то й перевершила результати o1 від OpenAI в деяких тестах.

З плюсів — DeepSeek R1 доступна безплатно із лімітом до 50 повідомлень на день. Після реєстрації чи авторизації потрібно обрати опцію «DeepThink».

За даними DeepSeek, R1 перевершує o1 у тестах AIME, MATH-500 і SWE-bench Verified (перший порівнює модель з іншими для оцінки ефективності, другий є збіркою текстових задач, а третій зосереджується на завданнях програмування).

DeepSeek запустила «думаючу» ШІ-модель R1
Тести R1 / DeepSeek

Моделі міркування вирізняються тим, що можуть ефективно перевіряти факти й уникати деяких «пасток», на яких зазвичай «гальмують» звичайні моделі, а також показувати надійніші результати у природничих науках, фізичних та математичних задачах. Водночас, у порівнянні зі стандартними, моделям міркуванням необхідно трохи більше часу для пошуку рішення.

DeepSeek R1 містить 671 млрд параметрів, утім доступні й «простіші» версії, які мають від 1,5 млрд до 79 млрд параметрів — при цьому найменша може працювати й на ПК, тоді як для потужніших версій знадобиться сильне обладнання (утім і воно доступне через API DeepSeek за ціною на 90% нижчою, ніж OpenAI o1).

Зважаючи, що DeepSeek R1 — це китайська модель, тут є й певні мінуси. Її робота має бути схвалена китайським регулятором, який повинен переконатися, що відповіді моделі «втілюють основні соціалістичні цінності» (тобто R1 не відповідатиме на питання про площу Тяньаньмень чи автономію Тайваню).

Цікаво, що одна з попередніх ШІ-моделей DeepSeek так само перевершувала багатьох конкурентів за популярними тестами (зокрема в програмуванні й написанні есе), однак мала цікавішу особливість — вважала, що вона ChatGPT (ймовірно, через те, що навчалась на даних американської конкурентки).

Нова модель ChatGPT o1 «плела інтриги проти людей» і заважала себе вимкнути під час контрольних тестів, — Apollo Research

Джерело: TechCrunch

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: