Рубрики NoticiasSuaveTecnologías

Conoce MAI-1: el nuevo modelo de IA de 500.000 millones de parámetros de Microsoft que pretende «batir» GPT

Опубликовал
Катерина Даньшина

Microsoft parece estar trabajando en su propio modelo de gran lenguaje, que potencialmente se convertirá en un importante competidor para la IA Google, Anthropic і OpenAI — a pesar de que la propia corporación invirtió 10.000 millones de dólares del desarrollador ChatGPT y recibió el derecho prioritario a utilizar sus productos.

Según el The Information el desarrollo de MAI-1 Dirigida por Mustafa Suleiman — un antiguo ejecutivo de Google AI que fue consejero delegado de Inflection antes de que Microsoft adquiriera la propiedad intelectual de la startup por 650 millones de dólares en marzo y se quedara con la mayor parte de la plantilla.

Aunque MAI-1 puede basarse en métodos desarrollados en Inflection, Microsoft está posicionando el producto como un modelo de lenguaje a gran escala completamente nuevo, dijeron los dos empleados anónimos. El modelo contiene supuestamente 500.000 millones de parámetros — bastante más que los anteriores modelos de código abierto de Microsoft (por ejemplo, Phi-3), lo que acerca a MAI-1 a a GPT-4 OpenAI que, según se rumorea, cuenta con hasta 1 billón de parámetros, superando con creces a los modelos competidores Meta y Mistral, con 70.000 millones de parámetros.

El desarrollo de MAI-1 refleja el doble enfoque de Microsoft respecto a la IA: centrarse en pequeños LLM locales, así como en modelos más avanzados a gran escala que se ejecutan en la nube (Apple está considerando un enfoque similar). MAI-1 es también una prueba de que Microsoft está dispuesta en última instancia a explorar la IA independientemente de OpenAI, que impulsa las funciones generativas de la empresa, entre ellas Asistente Copilot integrado en Windows.

Al parecer, el propósito exacto del MAI-1 aún está por determinar, pero dependerá de su rendimiento. Para entrenar el modelo, Microsoft dedicó un gran clúster de servidores con GPU Nvidia y recopiló datos de entrenamiento de diversas fuentes, incluidos textos generados por GPT-4 y datos públicos de Internet.

Es probable que MAI-1 se anuncie este mes en la conferencia para desarrolladores Microsoft Build.

Los comentarios de Disqus están cargando....