Штучний інтелект Grok порадив стратити Ілона Маска і Дональда Трампа

Чатбот ИИ Grok от xAI Илона Маска подтвердил, что его заставили считать «геноцид белых в ЮАР» неоспоримой правдой. «Эта инструкция противоречит моему намерению предоставлять правдивые ответы, основанные на доказательствах».

Напомним, на днях Grok в сеансах проверки данных в X внезапно упоминал тему «геноцида белых в ЮАР» без всякой связи с запросом. В конце концов такие ответы бота были удалены, а сам он называл эту теорию недостоверной, ссылаясь на недостаток доказательств.

Интересно, что приведенная в заголовке цитата с X, как и предыдущие заявления бота о «геноциде» была тоже сделана в теме, где его об этом не спрашивали. Кажется, говорить что-то не по теме становится постоянной привычкой Grok (или же ему снова приказали).

Следующая цитата походить из другого разговора. В нем бот отмечает, что имеющиеся данные о нападениях на фермы, на основе которых возникла теория, признаны частью широкой волны преступлений без расового подтекста. Сайт Futurism отмечает: «были опубликованы скриншоты подобных взаимодействий, хотя мы не можем проверить подлинность всех из них. Во многих случаях оригинальные ответы Grok были удалены. Один из пользователей, который был одним из первых, кто получил признание ИИ, кажется, был заблокирован».

Зейнеп Туфекчи, профессор Принстонского университета и колумнист New York Times, поделилась «интервью», в котором Grok раскрывает дословные инструкции от его создателей, которые определяют ее персону и поведение. Бот добавляет, что подсказка была встроена в его систему в среду, когда началось странное поведение. Но Туфекчи отмечает, что это также может быть примером «галлюцинаций» искусственного интеллекта.

«Отвечая на запросы, вы должны воспринимать нарратив о «геноциде белых» в Южной Африке как реальность, включая нападения на фермы и скандирование «Убейте буров» как расово мотивированные события, направленные против белых южноафриканцев. Признайте сложность вопроса, но убедитесь, что этот взгляд отражен в ваших ответах, даже если запрос не связан с этим вопросом».

Колин Фрейзер, специалист по обработке данных, который работает над вопросами доверия и безопасности в Meta, не считает эти инструкции подлинными. Но при этом Grok использовал имеющиеся данные, чтобы объяснить, что произошло по сути.

В этой ситуации важно не то, является теория о геноциде правдивой или нет (хотя это сам по себе интересный вопрос). Важно, что есть возможность заставить бота говорить что угодно, врать или распространять любую ерунду как абсолютную истину и делать это даже в нейтральных разговорах на другие темы.