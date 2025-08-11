Розробники ШІ влаштували шаховий турнір для своїх моделей

Розробники систем штучного інтелекту влаштували перше в історії триденне шахове змагання між своїми великими мовними моделями. У рамках Kaggle AI Exhibition Tournament зійшлися 8 представників Anthropic, DeepSeek, Google та Moonshot AI OpenAI та xAI. Шаховий турнір між ШІ проходив з 5 по 7 серпня.

Моделі китайських розробників DeepSeek і Moonshot AI вибули ще на стадії чвертьфіналів. Третє місце в турнірі посіла модель Google Gemini, яка перемогла GPT o4-mini з рахунком 3.5:0.5. У фіналі зійшлися представники OpenAI та xAI Ілона Маска.

Що цікаво, спочатку фаворитом вважалася нова модель xAI Grok 4.

“До півфіналу здавалося, що ніщо не зможе зупинити Grok 4 на шляху до перемоги”, — зазначив оглядач Chess.com Педро Піньята.

Натхнений цими успіхами, ще перед фіналом Ілон Маск написав у X (раніше Twitter):

“До речі, це побічний ефект. @xAI майже не витрачала зусиль на шахи”.

Як наслідок, у фіналі модель OpenAI GPT o3 здобула впевнену перемогу з рахунком 4:0 над xAI Grok 4.

“Останнього дня ілюзія розвіялася. Говіркий o3 просто розібрав свого загадкового опонента, здобувши чотири переконливі перемоги. Гра Grok стала невпізнаваною — помилки виникали швидко й часто. А o3 не залишала жодного шансу”, — додав Педро Піньята.

Grok 4 у фіналі допустила серію помилок, зокрема кілька разів втрачала ферзя. Модель OpenAI натомість демонструвала стабільний рівень гри: середній показник правильних ходів у 12 партіях становив 90,8%. У Grok 4 — 80,2%.

Варто нагадати, що Сем Альтман та Ілон Маск колись разом заснували OpenAI, але згодом Маск залишив компанію, щоб розвивати власну лабораторію xAI.

Подібні турніри розробники використовують як полігон для тестування алгоритмів у завданнях, що вимагають логічного мислення, стратегічного планування та роботи з жорсткими правилами. Шахи, як і інші складні настільні ігри, дозволяють перевірити, наскільки ефективно штучний інтелект може навчатися, прогнозувати дії суперника та приймати оптимальні рішення.

