CEO OpenAI Сем Альтман / Depositphotos
El asistente de inteligencia artificial del startup chino DeepSeek ha superado por primera vez a ChatGPT y se ha convertido en la aplicación gratuita más popular en la App Store en EE. UU., según datos de Sensor Tower (a través de Reuters).
DeepSeek V3 es un modelo de código abierto que se ha desempeñado bastante bien en pruebas clave y ha demostrado que puede competir con los modelos líderes de la industria, al mismo tiempo que muestra «mejoras» en tareas de razonamiento lógico. V3 utiliza la arquitectura Mixture-of-Experts (MoE) con un total de 671 mil millones de parámetros, donde 37 mil millones se activan para cada token (en comparación, el predecesor V2 tenía 236 mil millones de parámetros con una activación de 21 mil millones de parámetros para cada token).
Es interesante que DeepSeek V3 usó «un clúster de más de 2000 chips Nvidia» — en comparación con decenas de miles de chips para entrenar modelos de tamaño similar, en los que las empresas estadounidenses gastan millones de dólares.
Esta es también la misma modelo que se consideraba ChatGPT — aquí explicaron por qué esto sucede.
En los últimos años, los gigantes tecnológicos y startups chinos han lanzado una serie de modelos de IA, pero fue DeepSeek el que logró captar la atención a nivel mundial y causar pánico en las oficinas del Valle del Silicio. Recientemente, la compañía lanzó al público el modelo de razonamiento R1, lo que impulsó a OpenAI a mover su modelo o3-mini a la versión gratuita de ChatGPT.
R1 también tiene sus propios récords — se ha convertido en el modelo más descargado en HuggingFace (más de 100 mil descargas el 25 de enero). Además, hace unos días, analistas independientes de Chatbot Arena (plataforma organizada por investigadores de la Universidad de California en Berkeley) añadieron los modelos V3 y R1 a la lista de los diez mejores chatbots en términos de rendimiento.