Ілон Маск представив «думаючі» моделі Grok 3 і Grok 3 mini — конкурентів DeepSeek та OpenAI із «страшно розумним» ШІ

Опублікував Катерина Левицька

18.02.2025 08:33

Ілон Маск і команда xAI / X

Компанія штучного інтелекту Ілона Маска випустила свою останню флагманську модель штучного інтелекту Grok 3 — відповідь xAI на моделі міркування OpenAI та китайської DeepSeek, яку просувають як «страшно розумний ШІ».

Зазначається, що для навчання Grok 3, xAI використовував величезний центр обробки даних у Мемфісі, який містить близько 200 000 графічних процесорів. Сам Маск зазначав, що остання модель була створена із «у 10 разів» більшими обчислювальними ресурсами, ніж Grok 2, і з розширеним набором навчальних даних, який нібито включає матеріали судових справ.

«Grok 3 на порядок потужніший, ніж Grok 2», — заявив Маск під час презентації, що транслювалась у понеділок. «Це ШІ, який максимально шукає правду, навіть якщо ця правда іноді суперечить тому, що є політично коректним».

Grok 3 — не єдина модель, а ціле сімейство, яке також включає меншу версію Grok 3 mini (вона відповідає на питання швидше, але може бути не такою точною). Наразі доступні лише окремі моделі в бета-версії, тоді як повноцінний запуск обіцяють на понеділок.

Результати тестів

За словами xAI, Grok 3 перевершує GPT-4o за тестами — включно з AIME, що оцінює продуктивність моделі за вибіркою математичних запитань, і GPQA, який оцінює моделі за допомогою задач з фізики, біології та хімії рівня PhD. Рання версія Grok 3 також нібито отримала конкурентоспроможні результати в тестах Chatbot Arena, яка протиставляє різні моделі штучного інтелекту та збирає оцінки користувачів на їхні відповіді.

Дві варіації Grok 3 — Grok 3 Reasoning і Grok 3 mini Reasoning — можуть ретельно «продумувати» проблеми, подібно до «моделей міркування», таких як o3-mini від OpenAI й R1 китайської DeepSeek. Моделі міркування відомі тим, що ретельно перевіряють себе, перш ніж оприлюднили результати, і це дає їм змогу уникнути деяких пасток, на яких зазвичай «гальмують» стандартні.

Стартап Маска також сміливо стверджує, що Grok 3 Reasoning перевершує найкращу версію o3-mini — o3-mini-high — за кількома популярними тестами, включаючи новіший математичний тест під назвою AIME 2025.

Доступність

Моделі міркування, які xAI просуває як такі, що найкраще справляються із запитами про математику, науку чи програмування, будуть доступні у вебверсії програми Grok чи застосунку iOS — для складніших завдань передбачені опції «Think» та «Big Brain» (остання при цьому залучає «додаткові обчислення»), також є опція DeepSearch (глибокого пошуку, на кшталт тієї, що нещодавно презентувала OpenAI).

Маск зазначив, що деякі «думки» моделей міркування у програмі будуть приховані, щоб запобігти дистиляції — методу, який наразі використовують розробники моделей ШІ, щоб запозичити дані з інших моделей. OpenAI нещодавно запідозрила, що саме таким чином навчалась модель DeepSeek, яка нібито взяла дані з ChatGPT.

Початково доступ до Grok 3 отримають власники передплати Premium+ на X, однак для розширених функцій тепер пропонується новий тарифний план під назвою SuperGrok, який за $30 на місяць (або $300 на рік), розблокує додаткові міркування та запити DeepSearch, а також забезпечить створення необмеженої кількості зображень.

Приблизно за тиждень Grok 3 (і попередниці) отримає «голосовий режим», а за кілька тижнів надійде у корпоративний API xAI разом із функцією DeepSearch. Також Маск обіцяє, що за кілька місяців відкриє вихідний код Grok 2.

«Наш підхід полягає в тому, що ми відкриваємо вихідний код останньої версії, коли наступна буде повністю випущена. Коли Grok 3 стане зрілим і стабільним, а це, ймовірно, протягом кількох місяців, тоді ми запустимо Grok 2 з відкритим кодом».

Джерело: TechCrunch

Опублікував Катерина Левицька

Теги GrokІлон МаскШтучний інтелект

18.02.2025 08:33

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.

Ілон Маск представив «думаючі» моделі Grok 3 і Grok 3 mini — конкурентів DeepSeek та OpenAI із «страшно розумним» ШІ

Результати тестів

Доступність

Читайте також