Новини Тиждень ШІ 21.07.2025 comment views icon

NVIDIA представила локальні ШІ-моделі на базі DeepSeek R1 — від 1,5 млрд до 32 млрд параметрів

author avatar

Вадим Карпусь

Автор новин

NVIDIA представила локальні ШІ-моделі на базі DeepSeek R1 — від 1,5 млрд до 32 млрд параметрів

Останнім часом IT-компанії все більше уваги приділяють ШІ-моделям, здатним до логічних міркувань і вирішення завдань зі складними залежностями. NVIDIA також зробила крок у цьому напрямку, презентувавши серію моделей OpenReasoning-Nemotron, призначених для роботи із задачами з математики, фізики, інформатики та програмування. І головне, вони не потребують дорогих серверів чи доступу до хмари. Їх можна запускати локально — на ігровому комп’ютері з потужною відеокартою.

NVIDIA представила чотири варіанти моделі OpenReasoning-Nemotron з різною кількістю параметрів: 1,5 млрд, 7 млрд, 14 млрд і 32 млрд. Усі вони створені на основі набагато більшої моделі DeepSeek R1 0528, яка має 671 млрд параметрів. Компанія використала техніку дистиляції — стисла величезну «вчительську» модель до компактніших учнів, побудованих на основі Qwen‑2.5. Таким чином, складні обчислення та аналітичні можливості стали доступними не тільки дослідникам, а й ентузіастам.

Моделі навчені на основі 5 млн прикладів рішень з математики, науки та програмування. Ці дані були згенеровані через спеціальний інструмент NVIDIA NeMo Skills. Потім усі чотири версії OpenReasoning-Nemotron пройшли кероване навчання без використання методів з підкріпленням.

NVIDIA представила локальні ШІ-моделі на базі DeepSeek R1 — від 1,5 млрд до 32 млрд параметрів

Результати виявились досить оптимістичними. Найпотужніша з моделей, 32B, отримала 89,2 бала у математичному тесті AIME24 та 73,8 — на лютневому конкурсі HMMT. Але й найменша, 1.5B, не пасе задніх: 55,5 бала на AIME24 і 31,5 — на HMMT.

NVIDIA бачить у цих моделях зручний і ефективний інструмент для досліджень. Усі варіанти OpenReasoning-Nemotron будуть доступні для завантаження на платформі Hugging Face. Їх можна використовувати як основу для навчання за допомогою методів з підкріпленням, а також адаптувати для власних завдань. Додатковий режим GenSelect дозволяє запускати кілька паралельних відповідей і вибирати найкращу — завдяки цьому продуктивність 32B-моделі може наближатися або навіть перевищувати рівень OpenAI o3‑high на окремих тестах з математики та програмування.

NVIDIA представила локальні ШІ-моделі на базі DeepSeek R1 — від 1,5 млрд до 32 млрд параметрів

Завдяки прозорому процесу навчання без RL-алгоритмів (тобто без самостійного донавчання моделі через зворотний зв’язок), дослідники отримують «чисту» і сучасну відправну точку для подальших експериментів. А для ентузіастів і користувачів, які мають потужну відеокарту вдома, відкривається можливість запускати дійсно розумні ШІ-моделі локально.

Джерело: techpowerup, huggingface

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: