Noticias Suave 05-07-2024 a las 09:22 comment views icon

Conoce MAI-1: el nuevo modelo de IA de 500.000 millones de parámetros de Microsoft que pretende «batir» GPT

author avatar
https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg

Kateryna Danshyna

Redactor de noticias

Microsoft parece estar trabajando en su propio modelo de gran lenguaje, que potencialmente se convertirá en un importante competidor para la IA Google, Anthropic і OpenAI — a pesar de que la propia corporación invirtió 10.000 millones de dólares del desarrollador ChatGPT y recibió el derecho prioritario a utilizar sus productos.

Según el The Information el desarrollo de MAI-1 Dirigida por Mustafa Suleiman — un antiguo ejecutivo de Google AI que fue consejero delegado de Inflection antes de que Microsoft adquiriera la propiedad intelectual de la startup por 650 millones de dólares en marzo y se quedara con la mayor parte de la plantilla.

Aunque MAI-1 puede basarse en métodos desarrollados en Inflection, Microsoft está posicionando el producto como un modelo de lenguaje a gran escala completamente nuevo, dijeron los dos empleados anónimos. El modelo contiene supuestamente 500.000 millones de parámetros — bastante más que los anteriores modelos de código abierto de Microsoft (por ejemplo, Phi-3), lo que acerca a MAI-1 a a GPT-4 OpenAI que, según se rumorea, cuenta con hasta 1 billón de parámetros, superando con creces a los modelos competidores Meta y Mistral, con 70.000 millones de parámetros.

El desarrollo de MAI-1 refleja el doble enfoque de Microsoft respecto a la IA: centrarse en pequeños LLM locales, así como en modelos más avanzados a gran escala que se ejecutan en la nube (Apple está considerando un enfoque similar). MAI-1 es también una prueba de que Microsoft está dispuesta en última instancia a explorar la IA independientemente de OpenAI, que impulsa las funciones generativas de la empresa, entre ellas Asistente Copilot integrado en Windows.

Al parecer, el propósito exacto del MAI-1 aún está por determinar, pero dependerá de su rendimiento. Para entrenar el modelo, Microsoft dedicó un gran clúster de servidores con GPU Nvidia y recopiló datos de entrenamiento de diversas fuentes, incluidos textos generados por GPT-4 y datos públicos de Internet.

Es probable que MAI-1 se anuncie este mes en la conferencia para desarrolladores Microsoft Build.


Loading comments...

Spelling error report

The following text will be sent to our editors: