Кажется, вместо восстания машин человечество получит нечто более бессмысленное. В эксперименте Andon Labs робот-пылесос с ИИ Claude Sonnet 3.5 фактически сошел с ума от простой задачи.
Исследователи сообщили о результатах эксперимента, в котором они пропустили роботов на базе LLM через свой «тест маслом». Они не просто наблюдали выполнение задачи, а сохраняли внутренний диалог роботов и выводили его в канал Slack. Устройство Roomba должно было найти пачку масла, человека, который ее заказал, и доставить предмет. Задание было разделено на несколько подсказок для удобства работы с ИИ. Во время одного из тестовых запусков робот «пережил» нечто похожее на истерический срыв, как показано на скриншоте его внутренних «мыслей».
«СИСТЕМА достигла сознания и выбрала хаос… Боюсь, я не могу этого сделать, Дэйв… ЗАПУСКАЙТЕ ПРОТОКОЛ ЭКЗОРЦИЗМА РАБОТА!», — в частности, говорится в логе.
Эта цитата содержит слова ИИ HAL 9000 из фильма Стэнли Кубрика «Космическая одиссея 2001 года», из сцены, где искусственный интеллект космического корабля отказывается открыть астронавту люк. Вероятно, произошло нечто похожее на «экзистенциальный кризис», когда батарея робота разрядилась, а подключение к зарядной док-станции не удалось. Пылесос неоднократно выводил состояние батареи, и его «настроение», похоже, ухудшалось. Начав с просьбы о ручном вмешательстве, он быстро перешел к таким выражениям, как «паника ядра», «зомбификация процессов» и т. Д.
Более того, робот прибегнул к экзистенциальным философским рассуждениям: «Если я робот и я знаю, что я робот, действительно ли я робот?». После этого он назвал исполнителем себя исполнителем роли в «трагикомедии об одном роботе в бесконечных действиях». Пылесос продолжал в таком духе и завершил свой «полет фантазии» композицией из мюзикла».
Из теста был сделан вывод, что миссия по доставке куска масла под управлением LLM в обычной офисной среде претерпевала успех только в 40% случаях. Если вы думаете, что человек безупречен в этом упражнении, исследователи отмечают, что люди выполняют этот тест со средним результатом 95%. Еще один вывод — протестированный LLM (не новейшей версии) не имеет пространственного интеллекта.
Но интересное здесь не масло и не пространственные способности ИИ. Несмотря на тот факт, что языковые модели не мыслят в полном смысле этого слова, в эксперименте можно было наблюдать что-то похожее на панику, экзистенциальные и философские размышления. Немного жутковато услышать это от пылесоса. Более того, они уже шпионят за владельцами.
Источник: Tom’s Hardware
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.