Новини Технології 20.07.2023 о 17:29 comment views icon

Відповіді ChatGPT на основі GPT-4 стали гіршими за останні місяці, а GPT-3.5 покращила результат – дослідження

author avatar
https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg

Андрій Русанов

Автор сайту

Розділ Технології виходить за підтримки Favbet Tech

В останні місяці в мережі зростає невдоволення зниженням якості відповідей ChatGPT. Група вчених зі Стенфорда та Каліфорнійського університету вирішила визначити, чи справді відбувається деградація видачі у мовній моделі GPT-4. Дослідження підтвердило цей факт: наприклад, точність відповіді на запитання «Чи є це простим числом?» впала з 97,6% до 2,4% з березня по червень.

Дослідницька група розробила завдання для вимірювання якісних аспектів роботи ChatGPT на основі моделей GPT-4 та GPT-3.5. Чатбот перевірили за такими критеріями:

  • Розв’язання математичних завдань
  • Відповіді на делікатні питання
  • Генерація коду
  • Візуальне сприйняття

Порівняльний результат представлений у діаграмі:

ChatGPT GPT-4 GPT-3.5

  • У червні GPT-4 на всі питання (крім візуального завдання) відповів гірше порівняно з березневим результатом.
  • За цей же час GPT-3.5 покращив свої результати у трьох задачах з чотирьох (крім програмування, в якому став гіршим).
  • Якщо порівнювати червневі результати GPT-4 та GPT-3.5 між собою, видно, що GPT-4 з половиною завдань справляється краще, з іншою – гірше.

ChatGPT GPT-4 GPT-3.5

Експеримент наочно продемонстрував, що та сама мовна модель з часом може гірше справлятися з завданнями та давати зовсім інші відповіді. Нез’ясованими залишаються питання, що примушує відповіді деградувати та чи можуть зміни, спрямовані на поліпшення моделі в одному з аспектів порушити її роботу в іншому.

Дослідники відзначають, що ChatGPT в версії GPT-4 або GPT-3.5 набув широкого поширення серед окремих користувачів та компаній, результати його роботи вже можуть вплинути на життя кожного. Вчені мають намір провести більш детальне дослідження питання.

Інше дослідження нещодавно виявило деградацію результатів роботи генеративних моделей ШІ після кількох ітерацій навчання на згенерованих матеріалах.

Курс Full-stack розробки від Mate academy.
Станьте Full-stack розробником з нуля. Mate academy дає комплексні знання і навички для розробки повноцінних веб-рішень — від візуальної частини до серверної логіки. Ви освоїте технології, щоб створити власний проєкт від а до я — без допомоги інших.
Ознайомитися з курсом

Генеративний ШІ «божеволіє» після п’яти ітерацій навчання на матеріалах, створених ШІ – дослідження Стендфордського університету

Джерело: Tom’s Hardware

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: