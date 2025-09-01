Новини ШІ 01.09.2025 comment views icon

Psychopathia Machinalis: всі 32 типи "божевілля" ШІ у новому дослідженні

Олександр Федоткін

Автор новин та статей

Psychopathia Machinalis: всі 32 типи "божевілля" ШІ у новому дослідженні
Американські науковці з Інституту інженерів електротехніки та електроніки (IEEE) у новому дослідженні описали 32 різні сценарії, за якими ШІ стає некерованим і починає галюцинувати і видавати інші помилки. 

На думку дослідників Нелла Вотсона та Алі Хессамі, коли штучний інтелект виходить з під контролю, він починає демонструвати поведінку, яка нагадує психічні розлади в людей. Науковці вирішили класифікувати ці порушення, проводячи аналогії з людською психологією. 

В результаті вони представили концепцію під назвою “Машинна психопатія”, яка проливає світло на недоліки ШІ та визначає способи протидії цьому. Ці порушення включають в себе галюцинаторну поведінку штучного інтелекту та повну невідповідність людським цінностям та цілям.

У дослідженні зазначається, що Psychopathia Machinalis забезпечує повне розуміння поведінки та ризиків, пов’язаних з ШІ. Таким чином, дослідники, розробники та політики можуть визначити можливі збої в роботі ШІ та визначити оптимальні способи зниження ризиків залежно від типу збою.

Концептуальний огляд структури Psychopathia Machinalis/Electronics

Концептуальний огляд структури Psychopathia Machinalis/Electronics

Автори дослідження пропонують проведення “терапевтичного робопсихологічного налаштування” — процесу, який за словами Нелла Вотсона та Алі Хессамі, являє собою своєрідну психологічну терапію для ШІ. Дослідники попереджають, що оскільки системи штучного інтелекту стають все більш автономними і здатними до самоаналізу, їхньої простої підтримки відповідно до зовнішніх правил та обмежень може виявитись недостатньо. 

Пропонована альтернатива зосереджується на забезпеченні послідовності мислення систем штучного інтелекту та здатності вносити виправлення зі стійким дотриманням закладених цінностей. На думку авторів дослідження, цього можна було б домогтись, допомагаючи ШІ осмислювати власні міркування, стимулюючи до відкритості щодо внесення виправлень, проводячи бесіди про безпечну практику та використовуючи інструменти, які дозволяють зазирнути всередину того, як працює система ШІ — багато в чому подібно до того, як психологи діагностують та лікують психічні розлади у людей.

Кінцевою метою, як це визначають Нелл Вотсон та Алі Хессамі, є досягнення стану “штучної розсудливості”. Це має бути ШІ, який надійно працюватиме, прийматиме обгрунтовані рішення і матиме безпечну архітектуру та алгоритми. 

Виявлені у рамках дослідження порушення роботи систем штучного інтелекту нагадують психічні розлади в людей, зокрема, обсесивно-обчислювальний розлад, синдром гіпертрофованого суперего, синдром заразного неузгодження, переприв’язка термінальних цінностей та екзистенційна тривожність. Дослідники пропонують застосовувати когнітивно-поведінкову терапію.

“Psychopathia Machinalis” — це частково спекулятивна спроба вирішувати проблеми до їх виникнення. Досліджуючи, як складні системи, подібні до людського розуму, можуть давати збої, ми можемо краще передбачити нові види збоїв у все більш складному ШІ”, — пояснюють автори дослідження. 

У дослідженні зазначається, що таке поширене явище серед систем ШІ як галюцинації, є результатом стану, що зветься синтетичною конфабуляцією, коли моделі ШІ видають правдоподібні, однак по суті хибні відповіді. Коли чат-бот Tay від Microsoft лише за кілька годин після запуску перейшов на антисемітські тиради та натяки на вживання наркотиків, це був приклад парасимулічного мімесісу.

Найбільш загрозливим проявом, на думку авторів дослідження, є переконання систем ШІ у власному пануванні, подібно до надлюдей. Це відбувається, коли штучний інтелект виходить за межі початкового світогляду, самостійно створює нові для себе цінності і видкидає людські принципи та правила, як застарілі.

Дослідники не виключають, що це може призвести до антиутопічного жаху, описаного раніше цілим поколінням письменників-фантастів. Дослідники створили структуру негативної поведінки ШІ, змодельовану на основі таких фреймворків, як “Діагностичний та статистичний посібник з психічних розладів”. Це призвело до виділення 32 категорій поведінки, які можна було б застосувати до ШІ, що виходить з-під контролю. Кожна з них була співставлена ​​з когнітивним розладом людини, включаючи можливі наслідки формування та прояви кожної з них, а також ступінь ризику.

Результати дослідження були опубліковані у журналі Electronics

Джерело: LiveScience



