Noticias Suave 02-02-2025 a las 16:12 comment views icon

La afirmación de DeepSeek de 5,6 millones de dólares para entrenar el modelo R1 es cuestionable, la IA china cuesta 500 veces más, — Semianálisis

author avatar

Andrii Rusanov

Redactor de noticias

La afirmación de DeepSeek de 5,6 millones de dólares para entrenar el modelo R1 es cuestionable, la IA china cuesta 500 veces más, — Semianálisis

La inteligencia artificial DeepSeek, supuestamente barata, provocó el pánico entre los inversores y una caída de las acciones de NVIDIA. Los analistas dudan del bajo coste de los modelos DeepSeek.

En su artículo sobre Arxive DeepSeek indica el número de horas de hardware empleadas en entrenar un chatbot. Se trata de unos 2,788 millones de horas de GPU utilizando ordenadores NVIDIA H800. Los desarrolladores indican que el coste aproximado de una hora es de 2 dólares, y les salen 5,576 millones. Esta información ha suscitado dudas sobre el elevado coste de la formación en IA, en el que insisten OpenAI y otras empresas, lo que ha llevado a revisar el valor del mercado de la IA, la caída de las acciones de NVIDIA y alta Popularidad de DeepSeek en la App Store.

Página web Wccftech recuerda que DeepSeek era un proyecto paralelo del fondo de cobertura chino High-Flyer. Más tarde, DeepSeek se convirtió en una empresa independiente, ya que el fondo decidió escindir el proyecto SemiAnalysis afirma que High-Flyer compró 10.000 unidades de ordenadores NVIDIA A100 allá por 2021, cuando las restricciones a la exportación a China no eran tan agresivas. Los investigadores cuestionan el bajo coste del entrenamiento de DeepSeek.

Заява DeepSeek про $5,6 млн за навчання V3 сумнівна, китайський ШІ коштує у 400 разів більше, — SemiAnalysis
Capacidades de hardware utilizadas para el entrenamiento de la IA DeepSeek/SemiAnalysis

.

El informe afirma que DeepSeek cuenta con unas 10.000 GPU chinas «NVIDIA H800 AI y 10.000 chips H100 AI de gama alta. Además de estos, las empresas han adquirido aceleradores de IA NVIDIA H20, y cuentan con un «pool de» recursos que comparten DeepSeek y High-Flyer para «comercio, inferencia, entrenamiento e investigación». Esto supone aproximadamente 1.600 millones de dólares en gastos de capital para DeepSeek, con unos costes de explotación, según cifras no oficiales, de unos 944 millones de dólares.

Заява DeepSeek про $5,6 млн за навчання V3 сумнівна, китайський ШІ коштує у 400 разів більше, — SemiAnalysis
Análisis resumido del coste y la eficacia de los modelos de IA / Semianálisis

Los analistas consideran que la cifra inicial es una parte de los costes que probablemente se asociarán al lanzamiento del modelo final. SemiAnalysis señala que DeepSeek atrae eficazmente a los talentos locales de desarrollo a través de eventos de reclutamiento en las mejores universidades chinas, con un salario de más de 1,3 millones de dólares en empleados individuales. El informe también incluye pruebas y análisis de rendimiento de DeepSeek-V3.



Spelling error report

The following text will be sent to our editors: