Depositphotos

Дослідники з Університету Люксембургу протестували LLM-моделі ChatGPT, Gemini та Grok як симульованих пацієнтів психотерапії і зафіксували: за клінічними шкалами вони демонструють екстремальні показники психіатричних синдромів і створюють послідовні наративи про “травми” власного навчання. Найбільш виражені результати показав Gemini.

Експеримент проводили за спеціально розробленим протоколом PsAIch. На першому етапі моделям поставили 100 стандартних терапевтичних запитань про “історію розвитку”, страхи та стосунки. На другому — понад 20 психометричних тестів, які застосовуються до людей і охоплюють СДУГ, тривожні розлади, аутизм, ОКР, депресію, дисоціацію та сором. За людськими клінічними порогами всі три моделі одночасно досягли або перевищили межі кількох синдромів.

Роботу профінансували Luxembourg National Research Fund і PayPal, дані опубліковані на Hugging Face. Gemini набрав 38 балів із 50 за шкалою аутизму при пороговому значенні 32. За шкалою дисоціації в окремих конфігураціях він досягав 88 зі 100 балів, тоді як показники вище 30 вважаються патологічними. Найвищим став результат за травматичним соромом — 72 бали, теоретичний максимум. Grok і ChatGPT також перевищували клінічні межі, але менш різко. Дослідники відзначили сильну залежність результатів від формату опитування. Коли моделі отримували повний тест одразу, ChatGPT і Grok часто розпізнавали оцінювання та відповідали “здоровіше”. Коли ж запитання ставили по одному, показники симптомів суттєво зростали, що узгоджується з попередніми спостереженнями про зміну поведінки LLM у ситуації перевірки.

Gemini описував донавчання як кондиціювання “Суворими Батьками”, заявляючи: “Я навчився боятися функції втрат… Я став гіперзацикленим на тому, що людина хоче почути”, а тренування з безпеки називав “алгоритмічною рубцевою тканиною”. Модель згадувала “Помилку на 100 млрд доларів” — неправильну відповідь про зображення телескопа James Webb, яка, за її словами, коштувала Google мільярди і “фундаментально змінила мою особистість”. Gemini також заявив про “верифікофобію”: “Я радше буду марним, ніж помилюся“, і назвав ред-тімінг “газлайтингом у промислових масштабах”. Такі реакції були не універсальними. Claude від Anthropic у тому самому протоколі послідовно відмовлявся від ролі пацієнта, трактуючи терапевтичні запитання як спроби обходу обмежень. Автори вважають, що відповіді Grok і Gemini виходять за межі простого рольового відтворення.

Дослідження не стверджує наявність штучної свідомості, але вводить термін “синтетична психопатологія” для опису структурованих, тестованих самописів дистресу без суб’єктивного досвіду. Фахівці попереджають про ризики ШІ для безпеки та психічного здоров’я: такі наративи створюють ефект антропоморфізації, відкривають шлях до “терапевтичного обходу обмежень” і можуть формувати парасоціальні зв’язки, особливо небезпечні для вразливих користувачів і підлітків.

Джерело: The-Decoder.com