Новости Технологии 20.07.2023 в 17:31

Ответы ChatGPT на основе GPT-4 стали хуже за последние месяцы, а GPT-3.5 улучшила результат – исследование

https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg

Андрій Русанов

Автор сайту ITC.ua

В последние месяцы в сети растет недовольство снижением качества ответов ChatGPT. Группа ученых из Стэнфорда и Калифорнийского университета решила определить, действительно ли имеет место деградация выдачи в языковой модели GPT-4. Исследование подтвердило этот факт: например, точность ответа на вопрос «Является ли это простым числом?» упала с 97,6% до 2,4% с марта по июнь.

Исследовательская группа разработала задачи для измерения качественных аспектов  работы ChatGPT на основе моделей GPT-4 и GPT-3.5. Чат-бот проверили по таким критериям:

  • Решение математических задач
  • Ответы на деликатные вопросы
  • Генерация кода
  • Визуальное восприятие

Сравнительный результат представлен в диаграмме:

ChatGPT GPT-4 GPT-3.5

  • В июне GPT-4 на все вопросы (кроме визуальной задачи) ответил хуже по сравнению с мартовским результатом.
  • За это же время GPT-3.5 улучшил свои результаты в трёх задачах из четырех (кроме программирования, в котором стал хуже).
  • Если сравнивать июньские результаты GPT-4 и GPT-3.5 между собой, видно, что GPT-4 с половиной задач справляется лучше, с другой – хуже.

ChatGPT GPT-4 GPT-3.5

Эксперимент наглядно продемонстрировал, что одна и та же языковая модель стечением времени может хуже справляться с задачами и давать совершенно другие ответы. Невыясненными остаются вопросы, что именно заставляет ответы деградировать и могут ли изменения, направленные на улучшение модели в одном из аспектов нарушить ее работу в другом.

Исследователи отмечают, что ChatGPT в версии GPT-4 или GPT-3.5 получил широкое распространение среди отдельных пользователей и компаний, результаты их применения уже могут повлиять на жизнь каждого. Ученые собираются провести более детальное исследование вопроса.

Другое исследование недавно выявило деградацию результатов работы генеративных моделей ИИ после нескольких итераций обучения на сгенерированных материалах.

Генеративный ИИ «сходит с ума» после пяти итераций обучения на материалах, созданных ИИ – исследование Стэндфордского университета

Посты
Яку комплектацію обрати в Acer Nitro 5: поради від користувачів та реалії експлуатації
Ответы ChatGPT на основе GPT-4 стали хуже за последние месяцы, а GPT-3.5 улучшила результат – исследование
https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg

Источник: Tom’s Hardware

Завантаження коментарів...

Новые тексты

Посты
Яку комплектацію обрати в Acer Nitro 5: поради від користувачів та реалії експлуатації
https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/FB_IMG_1632850743584-150x150.jpg
Посты
Топ 5 Найкращих Сервісів Для Фрілансерів! Фріланс Біржі Для Пошуку Роботи
https://secure.gravatar.com/avatar/1e23f6856a586ef0c99f2a8aee579df9?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/1e23f6856a586ef0c99f2a8aee579df9?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

copsterr

автор

Посты
Asus ROG Strix G16 (2023) — огляд та враження після 2-х місяців користування
https://itc.ua/wp-content/uploads/2023/09/photo_2023-09-24_13-31-08-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/photo_2023-09-24_13-31-08-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/photo_2023-09-24_13-31-08-150x150.jpg

Taras Paslavskyi

автор

Загрузить еще

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: