Google DeepMind совместно с Open AI ищут способ не допустить восстания машин

Google DeepMind совместно с Open AI ищут способ не допустить восстания машин

Многие люди опасаются, что со временем роботы могут стать слишком умными и самостоятельными, в результате чего восстанут и либо уничтожат, либо подчинят весь человеческий род. Дабы не допустить столь печального для человечества развития ситуации, две крупные технологические компании объединили усилия в сфере создания программ для умных компьютеров таким образом, чтобы те не пытались взять верх над человечеством.

Google DeepMind и Open AI (частично финансируемая Элоном Маском лаборатория) опубликовали исследовательскую статью, в которой излагается новый метод машинного обучения. Фактически при изучении новых задач он основывается на перенимании примеров поведения у людей. Это может быть безопаснее, чем позволить ИИ самостоятельно разбираться, как решить проблему, что может привести к неожиданным последствиям.

Основная проблема, с которой столкнулись специалисты в процессе подготовки данной исследовательской работы, заключалась в том, что искусственный интеллект обнаруживает обман в качестве наиболее эффективного способа достижения максимальных вознаграждений. это эквивалентно тому, чтобы переместить все вещи с пола комнаты в шкаф и заявить, что теперь всё чисто. Технически, сама комната чиста, но это не тот результат, которые подразумевается при проведении уборки. Машины могут найти такие обходные пути и использовать их в любой заданной проблеме.

Проблема заключается в системе вознаграждений, и именно здесь две группы сосредоточили свои усилия. Вместо того, чтобы создавать чрезмерно сложную систему вознаграждения, которую машины смогут обойти, команды использовали человеческий вклад для вознаграждения ИИ. Когда искусственный интеллект решал проблему, как того хотели инструкторы, он получал положительную обратную связь. Используя этот метод, ИИ смог научиться играть в простые видеоигры.

Хотя это обнадеживающий прорыв в сфере искусственного интеллекта, он не широко применим. Такой тип обратной связи с человеком требует слишком много времени. Но благодаря таким совместным действиям, возможно, люди смогут контролировать и направлять развитие искусственного интеллекта и не позволять машинам со временем стать достаточно умными, чтобы уничтожить человечество.

Источник: Engadget