NVIDIA представила локальні ШІ-моделі на базі DeepSeek R1 — від 1,5 млрд до 32 млрд параметрів

Останнім часом IT-компанії все більше уваги приділяють ШІ-моделям, здатним до логічних міркувань і вирішення завдань зі складними залежностями. NVIDIA також зробила крок у цьому напрямку, презентувавши серію моделей OpenReasoning-Nemotron, призначених для роботи із задачами з математики, фізики, інформатики та програмування. І головне, вони не потребують дорогих серверів чи доступу до хмари. Їх можна запускати локально — на ігровому комп’ютері з потужною відеокартою.

NVIDIA представила чотири варіанти моделі OpenReasoning-Nemotron з різною кількістю параметрів: 1,5 млрд, 7 млрд, 14 млрд і 32 млрд. Усі вони створені на основі набагато більшої моделі DeepSeek R1 0528, яка має 671 млрд параметрів. Компанія використала техніку дистиляції — стисла величезну «вчительську» модель до компактніших учнів, побудованих на основі Qwen‑2.5. Таким чином, складні обчислення та аналітичні можливості стали доступними не тільки дослідникам, а й ентузіастам.

Моделі навчені на основі 5 млн прикладів рішень з математики, науки та програмування. Ці дані були згенеровані через спеціальний інструмент NVIDIA NeMo Skills. Потім усі чотири версії OpenReasoning-Nemotron пройшли кероване навчання без використання методів з підкріпленням.

Результати виявились досить оптимістичними. Найпотужніша з моделей, 32B, отримала 89,2 бала у математичному тесті AIME24 та 73,8 — на лютневому конкурсі HMMT. Але й найменша, 1.5B, не пасе задніх: 55,5 бала на AIME24 і 31,5 — на HMMT.

NVIDIA бачить у цих моделях зручний і ефективний інструмент для досліджень. Усі варіанти OpenReasoning-Nemotron будуть доступні для завантаження на платформі Hugging Face. Їх можна використовувати як основу для навчання за допомогою методів з підкріпленням, а також адаптувати для власних завдань. Додатковий режим GenSelect дозволяє запускати кілька паралельних відповідей і вибирати найкращу — завдяки цьому продуктивність 32B-моделі може наближатися або навіть перевищувати рівень OpenAI o3‑high на окремих тестах з математики та програмування.

Завдяки прозорому процесу навчання без RL-алгоритмів (тобто без самостійного донавчання моделі через зворотний зв’язок), дослідники отримують «чисту» і сучасну відправну точку для подальших експериментів. А для ентузіастів і користувачів, які мають потужну відеокарту вдома, відкривається можливість запускати дійсно розумні ШІ-моделі локально.

Джерело: techpowerup, huggingface

ЧИТАЦЬКА ДУМКА

В матеріалі написана нісенітниця? Претендуєте на експертність? Не згодні з автором? Ви справжній ерудит? — Тоді дайте аргументну відповідь, яка не загубиться в коментарях! Для цього навіть не потрібна реєстрація. Але тут не пишуть коротко — тільки ґрунтовна думка, не менше 77 слів.