Alibaba представляет ИИ Qwen-3 с 1 трлн параметров

Alibaba представляє ШІ Qwen-3 з 1 трлн параметрів

Китайский техногигант Alibaba выпустил новую модель ИИ Qwen-3-Max-Preview с более трлн параметров.

Параметры определяют точность модели ИИ. Однако большое количество параметров требует больших вычислительных мощностей для их настройки и большего количества энергии.

В настоящее время модель GPT-4.5 от OpenAI считается одной из самых масштабных в мире. Вероятно, она включает в себя от 5 до 7 трлн параметров.

Qwen-3-Max-Preview — текстовая модель ИИ, которая превзошла лучшую модель от Alibaba Qwen3-235B-A22B-2507, выпущенную в июле этого года.

Китайская компания обнародовала результаты бенчмарков, согласно которым, Qwen-3-Max-Preview обошла Kimi K2 от MoonShot AI, версию Claude Opus 4 от Anthropic без логического мышления и DeepSeek V3.1 в пяти тестах. Однако эти результаты не были подтверждены в официальном техническом отчете. 

«Qwen3-Max-Preview демонстрирует существенный прирост в общих возможностях, включая лучшее понимание китайского и английского текстов, сложных инструкций, выполнение субъективных открытых задач, многоязычность и вызов инструментов. Масштабирование работает, а официальный релиз удивит вас еще больше», — заявляют в Alibaba. 

Серия ИИ моделей Qwen позволила Alibaba занять первое место в мире по популярности среди систем искусственного интеллекта с открытым исходным кодом. На платформе для разработчиков с открытым исходным кодом Hugging Face ИИ модели от Alibaba загрузили более 20 млн раз и создали 100 тыс производных версий.

У Qwen-3-Max-Preview пока нет открытого исходного кода, однако сама модель доступна на официальных каналах. Предыдущая модель  Qwen2.5-Max также не имела открытого исходного кода. По словам инженера по ИИ в Alibaba Биньюаня Хуэя, вскоре должна появиться версия Qwen-3-Max-Preview с логическим мышлением. 

Qwen-3-Max-Preview имеет многоуровневую ценовую политику со ставкой $0,861 за млн входных токенов и $3,441 за млн токенов на выходе. Это делает эту модель одной из самых дорогих в серии Qwen. По сравнению с ней, версия Qwen3-235B-A22B-2507 без логического мышления берет $0,287 за млн входных токенов и $1,147 за млн выходных токенов. Новая модель Kimi K2 берет $0,6 за млн входных токенов и $2,5 — за млн выходных.

В Alibaba планируют выделить $52 млрд на инфраструктуру для ИИ в течение следующих трех лет. В СМИ также распространилась информация, что китайский техногигант занимается разработкой собственного процессора для ИИ, стремясь снизить зависимость от чипов Nvidia.

Источник: Interesting Engineering

