OpenAI выпустила o3 и o4-mini — первые модели ИИ, которые «думают картинками»

Опубликовал Катерина Даньшина

OpenAI представила свои новые модели ИИ — o3 и o4-mini, которые используют все доступные фичи ChatGPT (поиск в интернете, генерация картинок и т.д.), но получили дополнительную опцию «рассуждения изображениями».

OpenAI o3 — самая мощная на сегодня модель рассуждения, которая отметилась рекордными результатами в тестах на программирование, математике, естественных науках и визуальном восприятии. По предварительным оценкам, эта версия ИИ делает на 20% меньше серьезных ошибок, чем o1.

OpenAI o4-mini — компактная модель (по сути, уменьшенная версия o3), которую оптимизировали для быстрых и экономических соображений. Она демонстрирует лучшие результаты среди всех моделей на математических соревнованиях AIME 2024 и 2025.

Обе впервые могут интегрировать изображения непосредственно в цепочку мыслей — и не просто «видят» картинки, но и думают с их помощью, решая недоступные ранее задачи, которые сочетают визуальное и текстовое мышление. OpenAI отмечает, что модели также смогут корректировать картинки, увеличивая их или вращая «в рамках процесса рассуждения».

Доступ к o3 и o4-mini уже получили пользователи ChatGPT Plus, Pro и Team, тогда как для Enterprise и Edu модели поступят через неделю. Бесплатные пользователи смогут попробовать o4-mini, выбрав опцию Think перед отправкой запроса.

Что касается API, то о3 получила более дешевую цену: $10/$40 для миллиона входящих/исходящих токенов (по сравнению с $15/$60 для о1); тогда как плата за o4-mini, такая же, как и для o3-mini — $1,10/$4,40.

Напомним, что на днях OpenAI выпустила спецмодели ИИ для айтишников под названиями GPT-4.1, GPT-4.1 mini и GPT-4.1 nano, а в ближайшие недели ждем релиз o3-pro — версию o3, которая использует больше вычислительных ресурсов для создания ответов, исключительно для подписчиков ChatGPT Pro.

Источник: The Verge, TechCrunch