Новини Технології 30.04.2025 о 16:50 comment views icon

Xiaomi запустила свою першу ШІ-модель MiMo на 7 млрд параметрів

author avatar

Олександр Федоткін

Автор новин та статей

Xiaomi запустила свою першу ШІ-модель MiMo на 7 млрд параметрів
Depositphotos
Розділ Технології виходить за підтримки

Китайський виробник смартфонів та електрокарів Xiaomi представив першу власну розробку мовної моделі штучного інтелекту MiMo.

Ця модель має відкритий вихідний код і включає в себе 7 млрд різних параметрів. Стверджується, що за результатами тестів на продуктивність MiMo обійшла o1-mini від OpenAI та QwQ-32B-Preview від Alibaba Group.

У Xiaomi заявляють, що перша велика мовна модель компанії розроблялась з використанням навчання та підкріплення з боку спеціалізованої цільової групи з ШІ під назвою Core. До цього китайські ЗМІ повідомляли, що у грудні минулого року компанія придбала близько 10 тис. графічних процесорів для навчання MiMo.

Окрім цього у Xiaomi намагались найняти на роботу Ло Фулі — розробницю іншої китайської моделі ШІ DeepSeek. Однак дівчина відмовилась. Між тим амбіції Xiaomi включають прагнення створити загальну модель штучного інтелекту. Хоча компанія презентувала MiMo пізніше за моделі від DeepSeek та Alibaba, там переконані, що встигнуть зрівнятись з конкурентами  у гонитві за створення AGI.

Між тим в OpenAI заявляють, що їхня остання модель ШІ GPT-4.5, випущена у лютому, перша, що викликає враження спілкування з вдумливою людиною.

Великі технологічні компанії вкладають мільярди в інфраструктуру штучного інтелекту. Очікується, що цього року сукупні капітальні витрати Microsoft, Amazon, Google та Meta складуть $320 млрд для розширення можливостей у сфері штучного інтелекту.

Зі свого боку Google оновила сімейство «відкритих» моделей Gemma AI і представила Gemma 3 — найпотужніший ШІ на сьогодні, за словами самої компанії, який можна запустити на одній відеокарті.

Каліфорнійський стартап Inception Labs представив першу у світі велику мовну модель на основі дифузії, розроблену для комерційного використання. Дифузія – це техніка, яку штучний інтелект зазвичай використовує для генерації зображень та відео. Дифузія працює інакше – вона не рухається зліва направо, а створює весь текст одночасно. При цьому все починається з «шуму», який поступово очищується й отримується потік токенів.

Від ШІ не сховатись: нова версія ChatGPT визначає координати локації за одним фото

Джерело: South China Morning Post

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: