Новини Технології 20.07.2023 о 17:29

Відповіді ChatGPT на основі GPT-4 стали гіршими за останні місяці, а GPT-3.5 покращила результат – дослідження

https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg

Андрій Русанов

Автор сайту ITC.ua

В останні місяці в мережі зростає невдоволення зниженням якості відповідей ChatGPT. Група вчених зі Стенфорда та Каліфорнійського університету вирішила визначити, чи справді відбувається деградація видачі у мовній моделі GPT-4. Дослідження підтвердило цей факт: наприклад, точність відповіді на запитання «Чи є це простим числом?» впала з 97,6% до 2,4% з березня по червень.

Дослідницька група розробила завдання для вимірювання якісних аспектів роботи ChatGPT на основі моделей GPT-4 та GPT-3.5. Чатбот перевірили за такими критеріями:

  • Розв’язання математичних завдань
  • Відповіді на делікатні питання
  • Генерація коду
  • Візуальне сприйняття

Порівняльний результат представлений у діаграмі:

ChatGPT GPT-4 GPT-3.5

  • У червні GPT-4 на всі питання (крім візуального завдання) відповів гірше порівняно з березневим результатом.
  • За цей же час GPT-3.5 покращив свої результати у трьох задачах з чотирьох (крім програмування, в якому став гіршим).
  • Якщо порівнювати червневі результати GPT-4 та GPT-3.5 між собою, видно, що GPT-4 з половиною завдань справляється краще, з іншою – гірше.

ChatGPT GPT-4 GPT-3.5

Експеримент наочно продемонстрував, що та сама мовна модель з часом може гірше справлятися з завданнями та давати зовсім інші відповіді. Нез’ясованими залишаються питання, що примушує відповіді деградувати та чи можуть зміни, спрямовані на поліпшення моделі в одному з аспектів порушити її роботу в іншому.

Дослідники відзначають, що ChatGPT в версії GPT-4 або GPT-3.5 набув широкого поширення серед окремих користувачів та компаній, результати його роботи вже можуть вплинути на життя кожного. Вчені мають намір провести більш детальне дослідження питання.

Інше дослідження нещодавно виявило деградацію результатів роботи генеративних моделей ШІ після кількох ітерацій навчання на згенерованих матеріалах.

Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету

Дописи
Простий робочий ноутбук Acer Aspire A715-41G
Відповіді ChatGPT на основі GPT-4 стали гіршими за останні місяці, а GPT-3.5 покращила результат – дослідження
https://secure.gravatar.com/avatar/1072b7484f42d8b1ec11dfb6d74afa5f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/1072b7484f42d8b1ec11dfb6d74afa5f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

Yevhen Shatalov

автор

Джерело: Tom’s Hardware

Завантаження коментарів...

Нові тексти

Дописи
Простий робочий ноутбук Acer Aspire A715-41G
https://secure.gravatar.com/avatar/1072b7484f42d8b1ec11dfb6d74afa5f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/1072b7484f42d8b1ec11dfb6d74afa5f?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

Yevhen Shatalov

автор

Дописи
Король помер? Хай живе король! Огляд ігрового ноутбука Lenovo Legion Pro 5 16IRX8
https://itc.ua/wp-content/uploads/2023/09/IMG-ada6f4f87a1eaa33afc6aebfa508a6e9-V-1-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/IMG-ada6f4f87a1eaa33afc6aebfa508a6e9-V-1-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/IMG-ada6f4f87a1eaa33afc6aebfa508a6e9-V-1-150x150.jpg
Дописи
Чому ПК – голова, а ноут – таке собі пристрій
https://itc.ua/wp-content/uploads/2023/08/Bezymyannyj-150x150.png *** https://itc.ua/wp-content/uploads/2023/08/Bezymyannyj-150x150.png *** https://itc.ua/wp-content/uploads/2023/08/Bezymyannyj-150x150.png

ydri

автор

Загрузити ще

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: