Новини Софт 02.02.2025 о 15:54 comment views icon

Заява DeepSeek про $5,6 млн за навчання моделі R1 сумнівна, китайський ШІ коштує у 500 разів більше, — SemiAnalysis

author avatar

Андрій Русанов

Автор сайту

Заява DeepSeek про $5,6 млн за навчання моделі R1 сумнівна, китайський ШІ коштує у 500 разів більше, — SemiAnalysis
Depositphotos
Розділ Технології виходить за підтримки

Нібито недорогий штучний інтелект DeepSeek спричинив паніку серед інвесторів та падіння акцій NVIDIA. Аналітики сумніваються у низькій вартості моделей DeepSeek.

У своїй статті на Arxive DeepSeek вказує кількість апаратних годин, витрачених на навчання чатбота. Йдеться про 2,788 млн GPU-годин з використанням обчислювачів NVIDIA H800. Розробники вказують приблизну вартість години $2, і в них виходить $5,576 млн. Ця інформація спричинила сумніви у високій вартості навчання ШІ, про на який наполягають OpenAI та інші компанії, що привело до перегляду вартості ринку ШІ, падінню акцій NVIDIA  та високій популярності DeepSeek в App Store.

Сайт Wccftech нагадує, що DeepSeek був побічним проєктом китайського хедж-фонду High-Flyer. Згодом DeepSeek перетворився на окрему компанію, оскільки фонд вирішив виокремити проєкт. SemiAnalysis стверджує, що High-Flyer придбав 10 000 одиниць обчислювачів NVIDIA A100 ще у 2021 році, коли експортні обмеження до Китаю не були такими агресивними. Дослідники сумніваються у вказаній низькій вартості навчання DeepSeek.

Заява DeepSeek про $5,6 млн за навчання V3 сумнівна, китайський ШІ коштує у 400 разів більше, — SemiAnalysis
Апаратні потужності, використані для навчання ШІ DeepSeek / SemiAnalysis

У звіті йдеться, що DeepSeek має близько 10 000 «китайських» графічних процесорів NVIDIA H800 AI та 10 000 чипів вищого класу H100 AI. Крім них, компанії придбали прискорювачі штучного інтелекту NVIDIA H20, і вони мають «пул» ресурсів, які спільно використовуються DeepSeek та High-Flyer для «торгівлі, висновків, навчання та досліджень». Це означає приблизно $1,6 млрд капітальних витрат на DeepSeek, а операційні витрати, за неофіційними даними, становлять близько $944 млн. Це майже у 500 разів вищі витрати, ніж ті, що сколихнули ринок.

Заява DeepSeek про $5,6 млн за навчання V3 сумнівна, китайський ШІ коштує у 400 разів більше, — SemiAnalysis
Зведений аналіз вартості та ефективності моделей ШІ / SemiAnalysis

Аналітики вважають початкову цифру частиною витрат, ймовірно, пов’язаних лише із запуском остаточної моделі. SemiAnalysis відзначає ефективне залучення DeepSeek місцевих талантів для розробки за допомогою рекрутингових заходів у найкращих китайських університетах з зарплатою понад $1,3 млн в окремих працівників. Звіт також містить тестування та аналіз ефективності DeepSeek-V3.

Розбираємось із DeepSeek: безплатний аналог ChatGPT, але відповідає наче китайський комуніст, та не захищає дані

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: