Ілон Маск і команда xAI / X
Компанія штучного інтелекту Ілона Маска випустила свою останню флагманську модель штучного інтелекту Grok 3 — відповідь xAI на моделі міркування OpenAI та китайської DeepSeek, яку просувають як «страшно розумний ШІ».
Зазначається, що для навчання Grok 3, xAI використовував величезний центр обробки даних у Мемфісі, який містить близько 200 000 графічних процесорів. Сам Маск зазначав, що остання модель була створена із «у 10 разів» більшими обчислювальними ресурсами, ніж Grok 2, і з розширеним набором навчальних даних, який нібито включає матеріали судових справ.
«Grok 3 на порядок потужніший, ніж Grok 2», — заявив Маск під час презентації, що транслювалась у понеділок. «Це ШІ, який максимально шукає правду, навіть якщо ця правда іноді суперечить тому, що є політично коректним».
Grok 3 — не єдина модель, а ціле сімейство, яке також включає меншу версію Grok 3 mini (вона відповідає на питання швидше, але може бути не такою точною). Наразі доступні лише окремі моделі в бета-версії, тоді як повноцінний запуск обіцяють на понеділок.
За словами xAI, Grok 3 перевершує GPT-4o за тестами — включно з AIME, що оцінює продуктивність моделі за вибіркою математичних запитань, і GPQA, який оцінює моделі за допомогою задач з фізики, біології та хімії рівня PhD. Рання версія Grok 3 також нібито отримала конкурентоспроможні результати в тестах Chatbot Arena, яка протиставляє різні моделі штучного інтелекту та збирає оцінки користувачів на їхні відповіді.
Дві варіації Grok 3 — Grok 3 Reasoning і Grok 3 mini Reasoning — можуть ретельно «продумувати» проблеми, подібно до «моделей міркування», таких як o3-mini від OpenAI й R1 китайської DeepSeek. Моделі міркування відомі тим, що ретельно перевіряють себе, перш ніж оприлюднили результати, і це дає їм змогу уникнути деяких пасток, на яких зазвичай «гальмують» стандартні.
Стартап Маска також сміливо стверджує, що Grok 3 Reasoning перевершує найкращу версію o3-mini — o3-mini-high — за кількома популярними тестами, включаючи новіший математичний тест під назвою AIME 2025.
Моделі міркування, які xAI просуває як такі, що найкраще справляються із запитами про математику, науку чи програмування, будуть доступні у вебверсії програми Grok чи застосунку iOS — для складніших завдань передбачені опції «Think» та «Big Brain» (остання при цьому залучає «додаткові обчислення»), також є опція DeepSearch (глибокого пошуку, на кшталт тієї, що нещодавно презентувала OpenAI).
Маск зазначив, що деякі «думки» моделей міркування у програмі будуть приховані, щоб запобігти дистиляції — методу, який наразі використовують розробники моделей ШІ, щоб запозичити дані з інших моделей. OpenAI нещодавно запідозрила, що саме таким чином навчалась модель DeepSeek, яка нібито взяла дані з ChatGPT.
Початково доступ до Grok 3 отримають власники передплати Premium+ на X, однак для розширених функцій тепер пропонується новий тарифний план під назвою SuperGrok, який за $30 на місяць (або $300 на рік), розблокує додаткові міркування та запити DeepSearch, а також забезпечить створення необмеженої кількості зображень.
Приблизно за тиждень Grok 3 (і попередниці) отримає «голосовий режим», а за кілька тижнів надійде у корпоративний API xAI разом із функцією DeepSearch. Також Маск обіцяє, що за кілька місяців відкриє вихідний код Grok 2.
«Наш підхід полягає в тому, що ми відкриваємо вихідний код останньої версії, коли наступна буде повністю випущена. Коли Grok 3 стане зрілим і стабільним, а це, ймовірно, протягом кількох місяців, тоді ми запустимо Grok 2 з відкритим кодом».
Джерело: TechCrunch