Новини Технології 08.08.2023 о 18:05

ChatGPT під час дослідження провалив більш як половину питань із програмування

https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новин

Генеративний штучний інтелект часто помиляється, навіть розробники не рекомендують їх для створення коду програм. Щоб перевірити наскільки, команда Університету Перд’ю в США провела дослідження, передає TechSpot.

Загалом ChatGPT задали 517 питань із Stack Overflow (популярний ресурс питань і відповідей для професійних програмістів та ентузіастів). Відповіді оцінювали не лише за правильністю, але й за послідовністю, вичерпністю та лаконічністю.

ChatGPT під час дослідження провалив більш як половину питань із програмування

Інструмент OpenAI впорався із завданням далеко не відмінно. ChatGPT дав лише 48% правильних відповідей, а 77% описали як багатослівні. При цьому стиль та якість визначень часто переконували волонтерів у правильності, хоча це було не так.

Ми помітили, що лише тоді, коли помилка у відповіді ChatGPT очевидна, користувачі можуть її ідентифікувати.

Однак коли помилка більш комплексна, потребує додаткових знань або вивчення документації, користувачі часто не здатні визначити помилку, або недооцінюють її ступінь.

Навіть якщо відповідь ChatGPT була явно неправильною, двоє з 12 учасників все одно віддавали перевагу їй через приємний, впевнений і позитивний тон ШІ. Його вичерпність і підручниковий стиль написання також сприяли тому, що фактично неправильна відповідь здавалася правильною.

Відповіді ChatGPT на основі GPT-4 стали гіршими за останні місяці, а GPT-3.5 покращила результат – дослідження

Дописи
Як я став жертвою обману з боку інтернет-магазину Алло
ChatGPT під час дослідження провалив більш як половину питань із програмування
https://secure.gravatar.com/avatar/b2ace547966b314a7167ad6ba313e89e?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/b2ace547966b314a7167ad6ba313e89e?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

Завантаження коментарів...

Нові тексти

Дописи
Як я став жертвою обману з боку інтернет-магазину Алло
https://secure.gravatar.com/avatar/b2ace547966b314a7167ad6ba313e89e?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/b2ace547966b314a7167ad6ba313e89e?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png
Дописи
Занадто гарячий для гри? Питання теплового управління в ігрових ноутбуках
https://itc.ua/wp-content/uploads/2023/09/20210505_160740-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/20210505_160740-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/20210505_160740-150x150.jpg
Дописи
Старий японець проти Samsung: битва відеокамер (чи побиття) на прикладі Samsung S21 FE, Canon DC 21 та Samsung GT-i8262
https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg
Загрузити ще

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: