Новини Технології 11.07.2023 о 15:26

GPT-4 має 1,8 трлн параметрів на 120 рівнях — в мережі з’явилися деталі про архітектуру новітньої нейромережі OpenAI

https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg

Андрій Русанов

Автор сайту ITC.ua

Технічні подробиці про мовну модель GPT-4, яка нещодавно стала загальнодоступною, потрапили у Twitter, Reddit та Treadreader. У кількох словах модель в 10 разів більша, краще використовує ресурси та швидше працює, але вартість логічного виведення збільшилася у 3 рази.

GPT-4 оперує приблизно 1,8 трлн параметрів на 120 рівнях, що у 10 разів більше, ніж у GPT-3. Він використовує модель Mixture of Experts (MoE) з 16 експертами, кожен із яких має близько 111 млрд параметрів. Використання MoE дозволяє більш ефективно розпоряджатися ресурсами для логічного виведення, вимагаючи всього близько 280 млрд параметрів та 560 TFLOPs порівняно з 1,8 трлн параметрів та 3700 TFLOPs, необхідними для щільної моделі (старої).

Модель навчається приблизно на 13 трлн токенів з різних джерел, включаючи інтернет, книги та дослідницькі роботи. Щоб знизити витрати на навчання, OpenAI використовує тензорний та конвеєрний паралелізм, а також великий розмір пакета в 60 млн. Орієнтовна вартість навчання для GPT-4 становить близько $63 млн.

Хоча більша кількість експертів могла б покращити продуктивність моделі, OpenAI вирішили використати 16 через проблеми з узагальненням та конвергенцією. Вартість логічного висновку GPT-4 утричі вища, ніж у його попередника, DaVinci, в основному через необхідність у більших кластерах та нижчому ступені використання. Модель також включає окремий відеокодер з перехресною увагою для мультимодальних завдань, таких як читання вебсторінок та розшифровка зображень і відео.

OpenAI може використовувати спекулятивне декодування для виведення GPT-4, яке включає використання меншої моделі для попереднього прогнозування токенів та передачу їх у велику модель в одному пакеті. Цей підхід допоможе оптимізувати витрати на логічні висновки, але давати велику затримку.

Це короткий та спрощений виклад, хоч і він досить складний. Більше технічних деталей можна знайти тут.

OpenAI пока не обучает GPT-5 – Сэм Альтман говорит, что предстоит еще много подготовительных работ

Дописи
Доробка ноутбука своїми руками
GPT-4 має 1,8 трлн параметрів на 120 рівнях — в мережі з'явилися деталі про архітектуру новітньої нейромережі OpenAI
https://secure.gravatar.com/avatar/466cc937da7ddee57d70b7d4f791e803?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/466cc937da7ddee57d70b7d4f791e803?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

vovsir

автор

 

Завантаження коментарів...

Нові тексти

Дописи
Доробка ноутбука своїми руками
https://secure.gravatar.com/avatar/466cc937da7ddee57d70b7d4f791e803?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/466cc937da7ddee57d70b7d4f791e803?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

vovsir

автор

Дописи
Як я створив Вєнома і збираю нам на потреби ЗСУ
https://itc.ua/wp-content/uploads/2023/09/Kopiya-fajlu-22IMG_151122-1-150x150.jpeg *** https://itc.ua/wp-content/uploads/2023/09/Kopiya-fajlu-22IMG_151122-1-150x150.jpeg *** https://itc.ua/wp-content/uploads/2023/09/Kopiya-fajlu-22IMG_151122-1-150x150.jpeg
Дописи
В ІТ може кожен!
https://secure.gravatar.com/avatar/21ce5ca10b16ea75422707ed832a3f7f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/21ce5ca10b16ea75422707ed832a3f7f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

Denis

The warden of Middle-earth and son of Ukraine

Загрузити ще

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: