Depositphotos
OpenAI выпускает облегченную версию ИИ-агента для кодирования GPT-5.3-Codex-Spark, разработанную для ускоренной обработки данных.
Для выпуска этой модели был использован специализированный чип компании Cerebras, о партнерстве с которой на сумму в $10 млрд было объявлено в прошлом месяце. В OpenAI отмечают, что интеграция чипа Cerebras призвана ускорить работу ИИ.
GPT-5.3-Codex-Spark будет проводить ускоренные вычисления и работать на базе Wafer Scale Engine 3 от Cerebras — чипе третьего поколения с 4 трлн транзисторов. Новая модель ИИ для кодинга должна повысить производительность и помочь пользователям с быстрым прототипированием. Для более длительных и ресурсоемких задач предлагается использовать версию GPT-5.3 Codex.
«Codex-Spark — это первый шаг к Codex, который работает в двух дополняющих друг друга режимах: совместная работа в реальном времени, когда нужна быстрая итерация, и длительные задачи, когда необходимы более глубокие рассуждения и выполнения», — объясняют в OpenAI.
Сейчас Spark уже доступен пользователям ChatGPT Pro за $200 в месяц в приложении Codex в рамках предварительного тестирования. OpenAI также подчеркивает, что выпустила облегченную модель для обеспечения как можно меньшей задержки ИИ для кодинга.
Cerebras уже более 10 лет на рынке по производству чипов, однако именно развитие ИИ предоставило ей возможность играть заметную роль в техносекторе. На прошлой неделе компания объявила о привлечении инвестиций в размере $1 млрд. В целом она оценивается в $23 млрд.
В OpenAI утверждают, что новая модель программирует в 15 раз быстрее, оставаясь высокоэффективной для реального кодинга. Компания заявляет, что это первая модель, разработанная для работы с Codex в режиме реального времени, в частности, перестройки логики и уточнения интерфейсов, а также немедленного получения результата. Большинство инструментов ИИ для программирования требуют определенного времени для выполнения инструкций. Это может занимать от нескольких минут и дольше.
Spark благодаря улучшенной адаптивности поддерживает более гибкий диалоговый кодинг. Модель поддерживает прерывание и перенаправление выполнения задачи в процессе работы, что позволяет создавать тесные циклы итераций. По умолчанию этот ИИ ориентирован на легкие, целенаправленные правки и не прибегает к радикальным изменениям. Модель также не запускает тестирование в автоматическом режиме.
OpenAI удалось ускорить обработку на протяжении всего процесса запрос-ответ. Накладные расходы на обмен данными между клиентом и сервером сократились на 80%. Расходы на каждый токен сократились на 30%. Время получения первого токена сократилось на 50% благодаря оптимизации инициализации сессии и потоковой передачи данных. Интеграция постоянного соединения WebSocket также ускорила отклик, поскольку исчезла необходимость постоянно пересогласовывать соединение.
В OpenAI предупреждают, что при большом количестве запросов можно столкнуться с задержками в доступе или временными очередями, поскольку компания балансирует надежность для всех пользователей. Скорость будет оставаться высокой только если большое количество людей не захочет использовать быстрый доступ.
«В двух тестах SWE-Bench Pro и Terminal-Bench 2.0, оценивающих возможности агентской разработки программного обеспечения, GPT-5.3-Codex-Spark показывает худшие результаты, чем GPT-5.3-Codex, но может выполнить задачу за значительно более короткое время», — не скрывает разработчик.
Компания также признает, что GPT-5.3-Codex-Spark вряд ли достигнет порогового значения высокой эффективности в области кибербезопасности. Это означает, что эта не самая умная модель ИИ от OpenAI будет делать ошибки и делать это с большой скоростью, создавая менее защищенный код.
Мы писали, что OpenAI запустила приложение для программирования Codex на macOS бесплатно и с лимитами 2x. Осенью прошлого года OpenAI представила GPT-5-Codex-Mini — более эффективную модель для вайб-кодинга.
Источник: Techcrunch; ZDNet
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.