Чим особливий GPT-5.3-Codex-Spark

Для випуску цієї моделі було використано спеціалізований чип компанії Cerebras, про партнерство з якою на суму у $10 млрд було оголошено минулого місяця. В OpenAI зазначають, що інтеграція чипа Cerebras покликана прискорити роботу ШІ.

GPT-5.3-Codex-Spark проводитиме прискорені обчислення та працюватиме на базі Wafer Scale Engine 3 від Cerebras — чипі третього покоління з 4 трлн транзисторів. Нова модель ШІ для кодингу має підвищити продуктивність та допомогти користувачам зі швидким прототипуванням. Для більш тривалих та ресурсомістких задач пропонується використовувати версію GPT-5.3 Codex.

“Codex-Spark — це перший крок до Codex, який працює у двох доповнюючих один одного режимах: спільна робота в реальному часі, коли потрібна швидка ітерація, і тривалі завдання, коли необхідні глибші міркування та виконання”, — пояснюють в OpenAI.

Наразі Spark вже доступний користувачам ChatGPT Pro за $200 на місяць у застосунку Codex в рамках попереднього тестування. OpenAI також підкреслює, що випустила полегшену модель для забезпечення якомога мінімальної затримки ШІ для кодингу.





Cerebras вже понад 10 років на ринку з виробництва чипів, однак саме розвиток ШІ надав їй можливість відігравати помітну роль у техносекторі. Минулого тижня компанія оголосила про залучення інвестицій у розмірі $1 млрд. Загалом вона оцінюється у $23 млрд.

В OpenAI стверджують, що нова модель програмує у 15 разів швидше, залишаючись високоефективною для реального кодингу. Компанія заявляє, що це перша модель, розроблена для роботи з Codex в режимі реального часу, зокрема, перебудови логіки та уточнення інтерфейсів, а також негайного отримання результату. Більшість інструментів ШІ для програмування потребують певного часу для виконання інструкцій. Це може займати від кількох хвилин і довше.

Spark завдяки поліпшеній адаптивності підтримує більш гнучкий діалоговий кодинг. Модель підтримує переривання та перенаправлення виконання завдання у процесі роботи, що дозволяє створювати тісні цикли ітерацій. За замовчанням цей ШІ орієнтований на легкі, цілеспрямовані правки та не вдається до радикальних змін. Модель також не запускає тестування в автоматичному режимі.

OpenAI вдалось прискорити обробку протягом усього процесу запит-відповідь. Накладні витрати на обмін даними між клієнтом та сервером скоротились на 80%. Витрати на кожен токен скоротились на 30%. Час отримання першого токена скоротився на 50% завдяки оптимізації ініціалізації сесії та потокової передачі даних. Інтеграція постійного з’єднання WebSocket також прискорила відгук, оскільки зникла необхідність постійно переузгоджувати з’єднання.

На які проблеми можна очікувати при роботі з GPT-5.3-Codex-Spark

В OpenAI попереджають, що за великої кількості запитів можна зіткнутись із затримками у доступі або тимчасовими чергами, оскільки компанія балансує надійність для всіх користувачів. Швидкість залишатиметься високою тільки якщо велика кількість людей не захоче використовувати швидкий доступ.

“У двох тестах SWE-Bench Pro і Terminal-Bench 2.0, що оцінюють можливості агентної розробки програмного забезпечення, GPT-5.3-Codex-Spark показує гірші результати, ніж GPT-5.3-Codex, але може виконати завдання за значно коротший час”, — не приховує розробник.

Компанія також визнає, що GPT-5.3-Codex-Spark навряд чи досягне порогового значення високої ефективності в галузі кібербезпеки. Цей означає, що ця не найрозумніша модель ШІ від OpenAI робитиме помилки та робитиме це з великою швидкістю, створюючи менш захищений код.

Ми писали, що OpenAI запустила застосунок для програмування Codex на macOS: безплатно і з лімітами 2x. Восени минулого року OpenAI представила GPT-5-Codex-Mini — ефективнішу модель для вайб-кодингу.

