Новини Технології 08.08.2023 о 18:05 comment views icon

ChatGPT під час дослідження провалив більш як половину питань із програмування

author avatar
https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новин

Розділ Технології виходить за підтримки Favbet Tech

Генеративний штучний інтелект часто помиляється, навіть розробники не рекомендують їх для створення коду програм. Щоб перевірити наскільки, команда Університету Перд’ю в США провела дослідження, передає TechSpot.

Загалом ChatGPT задали 517 питань із Stack Overflow (популярний ресурс питань і відповідей для професійних програмістів та ентузіастів). Відповіді оцінювали не лише за правильністю, але й за послідовністю, вичерпністю та лаконічністю.

ChatGPT під час дослідження провалив більш як половину питань із програмування

Інструмент OpenAI впорався із завданням далеко не відмінно. ChatGPT дав лише 48% правильних відповідей, а 77% описали як багатослівні. При цьому стиль та якість визначень часто переконували волонтерів у правильності, хоча це було не так.

Ми помітили, що лише тоді, коли помилка у відповіді ChatGPT очевидна, користувачі можуть її ідентифікувати.

Однак коли помилка більш комплексна, потребує додаткових знань або вивчення документації, користувачі часто не здатні визначити помилку, або недооцінюють її ступінь.

Онлайн курс UI/UX Design Pro від Ithillel.
Навчіться проєктувати інтерфейси з урахуванням поведінки користувачів, розв'язувати їх проблеми через Customer Journey Mapping, створювати дизайн-системи і проводити дослідження юзабіліті, включаючи проєктування мобільних додатків для Android та iOS і розробку UX/UI на основі даних!
Дізнатися більше

Навіть якщо відповідь ChatGPT була явно неправильною, двоє з 12 учасників все одно віддавали перевагу їй через приємний, впевнений і позитивний тон ШІ. Його вичерпність і підручниковий стиль написання також сприяли тому, що фактично неправильна відповідь здавалася правильною.

Відповіді ChatGPT на основі GPT-4 стали гіршими за останні місяці, а GPT-3.5 покращила результат – дослідження

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: