Новини Софт 29.05.2025 о 08:10 comment views icon

DeepSeek R1 оновили: покращена модель зі 685 млрд параметрів вже у вільному доступі на Hugging Face

author avatar

Вадим Карпусь

Автор новин

DeepSeek R1 оновили: покращена модель зі 685 млрд параметрів вже у вільному доступі на Hugging Face
Depositphotos
Розділ Технології виходить за підтримки

У світі сучасних інформаційних технологій боротьба за створення найрозумнішої ШІ-моделі вже давно вийшла за межі Кремнієвої долини. Китайські розробники активно наздоганяють західних гігантів, і в цих перегонах стартап DeepSeek заявив про нову версію своєї потужної моделі R1. Її вже виклали на платформі Hugging Face, де розробники з усього світу можуть вільно її протестувати.

Що нового в моделі DeepSeek R1

DeepSeek повідомила про оновлення в офіційному дописі у WeChat. За словами компанії, це незначне оновлення, але все одно важливе — модель стала точнішою у складних логічних завданнях, які вимагають глибокого розуміння й аналізу. Модель має 685 млрд параметрів — це справді гігантські обсяги, які ставлять її в один ряд із найпотужнішими ШІ-системами у світі. Для порівняння: модель OpenAI GPT-3 має 175 млрд параметрів. Без модифікацій оновлена модель, ймовірно, не зможе працювати на комп’ютерному обладнанні споживчого рівня.

Нову версію DeepSeek R1 виклали з відкритою ліцензією MIT, тож її можна використовувати навіть у комерційних проєктах без юридичних обмежень. Цікаво, що репозиторій на Hugging Face містить лише конфігураційні файли та ваги — це ті внутрішні числові параметри, які фактично формують «мозок» моделі. Іншими словами, документація поки що мінімальна, але ентузіасти вже можуть почати експерименти.

Китайський стартап став відомим на початку року, коли представив модель R1. Вона показала вражаючі результати й змусила говорити про себе навіть фахівців, які раніше зосереджувалися виключно на продуктах OpenAI. Таке стрімке зростання викликало занепокоєння в окремих урядових установах у США. Там вважають, що подібні розробки можуть становити ризик для національної безпеки, адже їх можна застосовувати не лише в мирних цілях.

DeepSeek представила новий ШІ Janus Pro — генеративна модель краща за DALL-E 3

Джерело: techcrunch

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: