Xiaomi запустила свою першу ШІ-модель MiMo на 7 млрд параметрів

Опублікував Олександр Федоткін

Китайський виробник смартфонів та електрокарів Xiaomi представив першу власну розробку мовної моделі штучного інтелекту MiMo.

Ця модель має відкритий вихідний код і включає в себе 7 млрд різних параметрів. Стверджується, що за результатами тестів на продуктивність MiMo обійшла o1-mini від OpenAI та QwQ-32B-Preview від Alibaba Group.

У Xiaomi заявляють, що перша велика мовна модель компанії розроблялась з використанням навчання та підкріплення з боку спеціалізованої цільової групи з ШІ під назвою Core. До цього китайські ЗМІ повідомляли, що у грудні минулого року компанія придбала близько 10 тис. графічних процесорів для навчання MiMo.

Окрім цього у Xiaomi намагались найняти на роботу Ло Фулі — розробницю іншої китайської моделі ШІ DeepSeek. Однак дівчина відмовилась. Між тим амбіції Xiaomi включають прагнення створити загальну модель штучного інтелекту. Хоча компанія презентувала MiMo пізніше за моделі від DeepSeek та Alibaba, там переконані, що встигнуть зрівнятись з конкурентами  у гонитві за створення AGI.

Між тим в OpenAI заявляють, що їхня остання модель ШІ GPT-4.5, випущена у лютому, перша, що викликає враження спілкування з вдумливою людиною.

Великі технологічні компанії вкладають мільярди в інфраструктуру штучного інтелекту. Очікується, що цього року сукупні капітальні витрати Microsoft, Amazon, Google та Meta складуть $320 млрд для розширення можливостей у сфері штучного інтелекту.

Зі свого боку Google оновила сімейство «відкритих» моделей Gemma AI і представила Gemma 3 — найпотужніший ШІ на сьогодні, за словами самої компанії, який можна запустити на одній відеокарті.

Каліфорнійський стартап Inception Labs представив першу у світі велику мовну модель на основі дифузії, розроблену для комерційного використання. Дифузія – це техніка, яку штучний інтелект зазвичай використовує для генерації зображень та відео. Дифузія працює інакше – вона не рухається зліва направо, а створює весь текст одночасно. При цьому все починається з «шуму», який поступово очищується й отримується потік токенів.

Джерело: South China Morning Post