OpenAI представила моделі ШІ gpt-oss для запуску на відеокарті або ноутбуці

OpenAI анонсировала выпуск двух открытых языковых моделей искусственного интеллекта: gpt-oss-120b и gpt-oss-20b. Их создали как открытую альтернативу коммерческим моделям серии o, сохраняя при этом достаточно высокий уровень возможностей. Что интересно, их можно запускать локально на видеокартах и ноутбуки.

OpenAI предлагает две версии, которые отличаются по размеру и целевой платформе:

gpt-oss-120b — более мощная модель, которую можно запускать на одном GPU от NVIDIA;
gpt-oss-20b — более легкая версия, которая работает даже на ноутбуках с 16 ГБ оперативной памяти.

Это первые полноценно открытые модели OpenAI со времен GPT-2, которая вышла еще более 5 лет назад.

OpenAI позволяет использовать эти открытые модели как «мозг», который может делегировать задачи более мощным системам в облаке. Например, если gpt-oss не может обработать изображение, его можно подключить к одной из коммерческих моделей OpenAI, которая с этим справится.

Последние годы OpenAI делала ставку на закрытые модели, продавая доступ к ним через API. Однако конкуренция со стороны китайских лабораторий (DeepSeek, Qwen, Moonshot AI) и смена позиции самого CEO Сэма Альтмана заставили компанию переосмыслить подход.

Дополнительно, администрация президента Дональда Трампа призвала американские компании шире открывать свои ИИ-разработки, чтобы продвигать ценности, близкие к США, в глобальной технологической среде.

Как работают модели

Обе модели gpt-oss используют:

Mixture-of-Experts (MoE) — подход, который активирует только часть параметров при каждом запросе, что делает работу более эффективной. Например, в gpt-oss-120b активируется только 5,1 млрд из 117 млрд параметров на каждый токен.
Подкрепленное обучение (RL) — модели учились, получая обратную связь в симулированных сценариях. Этот же метод использовали и в коммерческих o-моделях OpenAI.

Также модели поддерживают «цепное мышление» — могут поэтапно анализировать задачи, привлекая дополнительные инструменты, такие как поиск в интернете или выполнение кода.

Но есть нюансы. Модели работают только с текстом — без изображений и звука. К тому же они «галлюцинируют» чаще, чем более мощные аналоги. Например, на тесте PersonQA модели gpt-oss давали неточные ответы в 49% и 53% случаев соответственно. Для сравнения, даже o4-mini «галлюцинирует» только в 36% случаев. При этом компания не открывает учебные данные, ссылаясь на юридические риски (существуют судебные иски против ИИ-компаний за использование защищенных авторским правом данных).

В тестах производительности новые модели показали неплохие результаты:

Codeforces (программирование): gpt-oss-120b — 2622, gpt-oss-20b — 2516 баллов. Лучше DeepSeek R1, но хуже OpenAI o3 и o4-mini.
HLE (Humanity’s Last Exam): 19% и 17,3% соответственно. Опять же — выше, чем у открытых конкурентов, но ниже закрытых моделей OpenAI.

Обе модели выпущены под лицензией Apache 2.0. Она позволяет бесплатно использовать модели в коммерческих продуктах, не спрашивая разрешения у OpenAI. Также в случае необходимости модели можно модифицировать код под собственные нужды.

Перед релизом OpenAI проверяла, можно ли использовать gpt-oss в злонамеренных целях — в частности для создания биооружия или кибератак. Риски оказались низкими, но компания признает: модели могут частично облегчить вредоносные сценарии, если их специально переобучить.

Обе модели уже доступны для загрузки на платформе Hugging Face.

Источник: techcrunch