Новини Софт 07.04.2025 о 11:55 comment views icon

Meta запустила перші дві моделі Llama 4: мультимодальні, швидкі та потужні — ще дві на підході

author avatar

Вадим Карпусь

Автор новин

Meta запустила перші дві моделі Llama 4: мультимодальні, швидкі та потужні — ще дві на підході
Розділ Технології виходить за підтримки

Meta представила перші дві моделі з мультимодального сімейства Llama 4: Llama 4 Scout та Llama 4 Maverick. Всього в сімействі буде чотири моделі. Дві з них вже запущені, а решта з’являться згодом. За словами Meta, всі вони навчалися на великій кількості неанотованого тексту, зображень та відео, щоб отримати широкі можливості візуального розуміння.

Причиною прискореного запуску нових моделей стало успішне просування відкритих моделей китайської лабораторії DeepSeek, які працюють на рівні або навіть краще за попередні моделі Meta. Згідно з повідомленнями, Meta терміново організувала «воєнні кімнати», щоб розібратися, як DeepSeek змогла знизити вартість запуску та використання моделей типу R1 і V3.

За словами компанії, Llama 4 Maverick — це «робоча конячка», яка найкраще справляється з розумінням зображень і тексту для «типових завдань асистента та спілкування в чаті». Натомість модель Llama 4 Scout підходить для таких завдань, як узагальнення кількох документів, аналіз великої кількості дій користувача для персоналізованих завдань та логічне опрацювання об’ємних кодових баз.

Meta також анонсувала Llama 4 Behemoth — майбутню модель, яку компанія називає «однією з найрозумніших ШІ-моделей у світі». Генеральний директор Марк Цукерберг додав, що четверта модель — Llama 4 Reasoning — буде представлена протягом наступного місяця.

Llama 4 Maverick і Scout уже доступні для завантаження на сайті Llama та на Hugging Face, а також вже інтегровані в Meta AI — зокрема у WhatsApp, Messenger та Instagram (у повідомленнях).

Технічні характеристики Llama 4

Llama 4 Scout має 17 млрд активних параметрів і 16 експертів. За словами Цукерберга, ця модель «надзвичайно швидка» та нативно мультимодальна. Вона має майже нескінченний контекст обсягом до 10 млн токенів. При цьому вона розроблена так, щоб працювати на одному графічному процесорі.

Llama 4 Maverick також має 17 млрд активних параметрів, але вже 128 експертів. Meta стверджує, що Maverick:

  • Перевершує GPT-4o, Gemini 2.0 у завданнях з кодування, логіки, багатомовності, роботи з довгим контекстом і зображеннями;
  • Конкурує з DeepSeek v3.1 за якістю логічних міркувань та кодування.

Llama 4 Behemoth

Ця модель ще перебуває на етапі тренування, але Meta вже заявляє, що це буде «найпотужніша базова модель у світі», з 288 млрд активних параметрів. І хоча вона ще не представлена, найближчим часом варто очікувати більше відомостей не лише про неї.

Також можна очікувати розкриття докладної інформації про модель Llama 4 Reasoning. Адже вже за кілька тижнів відбудеться велика конференція Meta для розробників ШІ — LlamaCon.

У січні 2025 року, протягом судового процесу з’ясувалося, що Meta Марка Цукерберга для навчання ШІ Llama незаконно використала мільйони книг.

OpenAI випустить модель з відкритими вагами ─ що це означає?

Джерело: techcrunch, engadget

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: