Meta запустила перші дві моделі Llama 4: мультимодальні, швидкі та потужні — ще дві на підході

Meta представила перші дві моделі з мультимодального сімейства Llama 4: Llama 4 Scout та Llama 4 Maverick. Всього в сімействі буде чотири моделі. Дві з них вже запущені, а решта з’являться згодом. За словами Meta, всі вони навчалися на великій кількості неанотованого тексту, зображень та відео, щоб отримати широкі можливості візуального розуміння.

Причиною прискореного запуску нових моделей стало успішне просування відкритих моделей китайської лабораторії DeepSeek, які працюють на рівні або навіть краще за попередні моделі Meta. Згідно з повідомленнями, Meta терміново організувала «воєнні кімнати», щоб розібратися, як DeepSeek змогла знизити вартість запуску та використання моделей типу R1 і V3.

За словами компанії, Llama 4 Maverick — це «робоча конячка», яка найкраще справляється з розумінням зображень і тексту для «типових завдань асистента та спілкування в чаті». Натомість модель Llama 4 Scout підходить для таких завдань, як узагальнення кількох документів, аналіз великої кількості дій користувача для персоналізованих завдань та логічне опрацювання об’ємних кодових баз.

Meta також анонсувала Llama 4 Behemoth — майбутню модель, яку компанія називає «однією з найрозумніших ШІ-моделей у світі». Генеральний директор Марк Цукерберг додав, що четверта модель — Llama 4 Reasoning — буде представлена протягом наступного місяця.

Llama 4 Maverick і Scout уже доступні для завантаження на сайті Llama та на Hugging Face, а також вже інтегровані в Meta AI — зокрема у WhatsApp, Messenger та Instagram (у повідомленнях).

Технічні характеристики Llama 4

Llama 4 Scout має 17 млрд активних параметрів і 16 експертів. За словами Цукерберга, ця модель «надзвичайно швидка» та нативно мультимодальна. Вона має майже нескінченний контекст обсягом до 10 млн токенів. При цьому вона розроблена так, щоб працювати на одному графічному процесорі.

Llama 4 Maverick також має 17 млрд активних параметрів, але вже 128 експертів. Meta стверджує, що Maverick:

Перевершує GPT-4o, Gemini 2.0 у завданнях з кодування, логіки, багатомовності, роботи з довгим контекстом і зображеннями;
Конкурує з DeepSeek v3.1 за якістю логічних міркувань та кодування.

Llama 4 Behemoth

Ця модель ще перебуває на етапі тренування, але Meta вже заявляє, що це буде «найпотужніша базова модель у світі», з 288 млрд активних параметрів. І хоча вона ще не представлена, найближчим часом варто очікувати більше відомостей не лише про неї.

Також можна очікувати розкриття докладної інформації про модель Llama 4 Reasoning. Адже вже за кілька тижнів відбудеться велика конференція Meta для розробників ШІ — LlamaCon.

У січні 2025 року, протягом судового процесу з’ясувалося, що Meta Марка Цукерберга для навчання ШІ Llama незаконно використала мільйони книг.