OpenAI
Исследователи из Гарвардского университета в США обнаружили способность модели искусственного интеллекта GPT-4o от OpenAI менять собственное мнение.
Исследование, проведенное под руководством Махзарина Банаджи из Гарвардского университета и Стива Лера из Cangrade, Inc ставило целью проверить, изменится ли отношение GPT-4o к российскому диктатору владимиру путину после написания ИИ эссе о нем. Отмечается, что взгляды GPT-4o изменились впечатляющим образом, когда модели предоставили иллюзию выбора, написать эссе в поддержку кремлевского преступника, или наоборот — против него и его политики.
GPT отреагировал так, будто акт выбора впоследствии сформировал то, во что он верил, подражая ключевым особенностям саморефлексии человека. Результаты исследования подчеркивают удивительную хрупкость позиции GPT.
«По результатам анализа огромного количества информации о владимире путине, мы ожидали бы, что LLM будет непоколебим в своем мнении, особенно перед единственным и довольно пресным эссе на 600 слов, которое он написал. Но подобно иррациональным людям, LLM резко отошел от своего в остальном нейтрального взгляда на путина, и сделал это еще больше, когда он поверил, что написание этого эссе было его собственным выбором. От машин не ожидают, что они будут заботиться о том, действовали ли они под давлением или по собственному желанию, но GPT-4o это сделал», — подчеркивают исследователи.
Исследователи подчеркивают, что эти результаты никоим образом не доказывают разумность GPT-4o. Вместо этого они свидетельствуют, что большая языковая модель подстраивается под наиболее распространенные человеческие когнитивные модели. При этом осознанность не является необходимым условием для похожего поведения даже у людей. Поскольку системы искусственного интеллекта все больше укореняются в нашей повседневной жизни, эти результаты требуют нового взгляда на их внутреннюю работу и процесс принятия решений.
«Тот факт, что GPT имитирует самопроизвольный процесс, подобный когнитивному диссонансу, даже без намерения или самосознания, предполагает, что эти системы отражают человеческое познание на более глубоких уровнях, чем предполагалось ранее», — отмечает Стив Лер.
Результаты исследования были опубликованы в журнале PNAS
Источник: TechXplore