Meta ha presentado los dos primeros modelos de la familia multimodal Llama 4: Llama 4 Scout y Llama 4 Maverick. En total, la familia contará con cuatro modelos. Dos de ellos ya han sido lanzados, y el resto aparecerán más adelante. Según Meta, todos ellos se entrenaron con una gran cantidad de texto, imágenes y vídeos sin anotar para obtener amplias capacidades de comprensión visual.
La razón del lanzamiento acelerado de nuevos modelos fue la exitosa promoción de modelos abiertos del laboratorio chino DeepSeekque rindan a la par o mejor que los anteriores modelos de Meta. Según los informes, Meta ha organizado urgentemente «salas de guerra» para averiguar cómo DeepSeek podría reducir el coste de lanzamiento y uso de los modelos R1 y V3.
Según la empresa, Llama 4 Maverick — es el «caballo de batalla» que hace el mejor trabajo de comprensión de imágenes y texto para «tareas típicas de asistente y chat». Llama 4 Scout, por su parte, es adecuado para tareas como resumir múltiples documentos, analizar un gran número de acciones del usuario para tareas personalizadas y procesar lógicamente grandes bases de código.
Meta también anunció Llama 4 Behemoth — un futuro modelo que la compañía denomina «uno de los modelos de IA más inteligentes del mundo». El CEO Mark Zuckerberg añadió que un cuarto modelo — Llama 4 Razonamiento — se presentará en el próximo mes.
Llama 4 Maverick y Scout ya están disponibles para su descarga en el sitio web de Llama y Hugging Face, y ya están integrados en Meta AI — incluyendo WhatsApp, Messenger e Instagram (en mensajes).
Llama 4 Scout cuenta con 17.000 millones de parámetros activos y 16 expertos. Según Zuckerberg, este modelo es «extremadamente rápido» y multimodal de forma nativa. Tiene un contexto casi infinito de hasta 10 millones de tokens. Al mismo tiempo, está diseñado para ejecutarse en una sola GPU.
Llama 4 Maverick también tiene 17 mil millones de parámetros activos, pero ya 128 expertos. Meta afirma que Maverick:
Este modelo aún está en fase de entrenamiento, pero Meta ya afirma que será «el modelo subyacente más potente del mundo», con 288.000 millones de parámetros activos. Aunque aún no se ha presentado, deberíamos esperar más información al respecto en un futuro próximo.
También podemos esperar saber más sobre el modelo de razonamiento Llama 4. Después de todo, dentro de unas semanas se celebrará una importante conferencia Meta para desarrolladores de IA — LlamaCon.
En enero de 2025, durante la pruebaprocesoresultó que la Meta de Mark Zuckerberg paraEntrenamiento en IA para llamasilegalmente millones de libros.
Fuente: techcrunch, engadget