Джарвис от Цукерберга: как гендиректор Facebook создал для себя виртуального ассистента

Джарвис от Цукерберга: как гендиректор Facebook создал для себя виртуального ассистента

Генеральный директор Facebook по-прежнему любит программировать. Марк Цукерберг предлагает нам эксклюзивный взгляд на свой новый проект, который умеет воспроизводить музыку, делать тосты, а иногда ещё и раздражает его жену.

Когда новые инженеры присоединяются к команде Facebook, неважно, выпускник колледжа или ветеран уровня вице-президента – свои первые шесть недель они проводят в тренировочном лагере (Facebook Engineering Bootcamp) по интенсивной программе, призванной помочь в изучении азов обширной базы исходного кода и постоянно эволюционирующего набора имеющихся в распоряжении программных инструментов.

Марк Цукерберг, основатель Facebook, сделал весомый вклад в этот код, больше чем, кто-либо, ещё в первые годы существования соцсети. Но 32-летний гендиректор не проходил программу подготовки, она была запущена в 2006 году, спустя 2 года с момента основания компании в комнате Гарвардского общежития.

В январе этого года, в задачах персонального роста, которые Марк ставит перед собой каждый год, Цукерберг объявил, что он планирует построить систему искусственного интеллекта и запустить её, используя инструменты Facebook, у себя дома. Увлекательное исследование современного ИИ – технологическое поле деятельности, необходимое для будущего Facebook, проект также заставил Цукерберга обновить команду соцсети, занимающуюся программными средствами и процессами. Что, в свою очередь, дало возможность присоединиться к ежедневной работе тысяч инженеров под его управлением и инженерной культуре в сердце одной из самых важных технологических компаний в мире.

Но исполнительный директор Facebook не та должность, которую можно оставить на 6 недель с целью продолжить образование. «Официально я не проходил стажировку в тренировочном лагере», – рассказал Цукерберг журналисту Fast Factory (кстати, ещё одного успешного проекта студентов Гарварда) в просторной гостиной своего классического деревянного дома, построенного из 113-летней древесины в Пало-Альто, Калифорния (Palo Alto, California), во время премьерного показа Джарвиса (Jarvis) и первого интервью, которое он дал об этом проекте из числа задач персонального роста. – «Но когда я задаю людям вопросы, можете представить, что они отвечают на них очень быстро».

Цукерберг всегда наслаждался тем, что он называет «детерминированной» природой разработки – возможности создать что-то, что делает именно то, чего вы от него хотели. Из-за всех амбициозных вещей, которые он пытается реализовать,  будучи руководителем компании со штатом более чем 15000 человек, имеющей миллиарды пользователей Messenger, WhatsApp, Instagram, Facebook, Цукерберг утратил это приятное ощущение.

Вот почему он продолжает изредка работать над небольшими проектами в свободное от работы время, и почему его личной задачей в 2012 году было «ни дня без кода». На протяжении нескольких лет он принимал участие в хакатонах компании и, в качестве упражнения, когда-то написал систему, которая объединила оргструктуру Facebook и внутренний социальный граф, чтобы увидеть, какие группы внутри компании были наиболее социально связаны.

Цукерберг признался, что часто, завершая сеанс программирования, чувствует себя примерно так же, как было, когда он изучал китайский язык, обозначенный как вызов самому себе в 2010 году. Он чувствует, как его мозг усиленно работает, горит.

Инженерная культура Facebook, однако, гласит, что если ваши разработка вышла из строя, вы должны отложить текущую работу и исправить её. Это неосуществимо для гиперзанятого, путешествующего генерального директора. «Мне нужно либо уходить со встреч, либо кто-то должен править мой код, что означает категоричное «нет и ещё раз нет», говорит он. Поэтому прошло достаточно много времени после того, как он последний раз писал какой-либо код на работе.

Тем не менее, за последний год Цукерберг потратил примерно 100-150 часов на свой домашний проект. И хотя он назван в честь Джарвиса, футуристического ИИ Тони Старка из фильмов о «Железном человеке», он больше похож на домашнюю, очень личную версию, (что-то вроде виртуального помощника Amazon Alexa) и предоставляет возможность ему и его супруге Присцилле Чан (Priscilla Chan), используя приложения для iPhone или бота в Facebook Messenger, включать/выключать свет, воспроизводить музыку, основанную на личных вкусах, открывать ворота для друзей, делать тосты и даже будить их годовалую дочь Макс уроками китайского.

Эксперименты в нерабочее время

Когда вы посещаете дом Марка Цукерберга, расположенный на территории 1580 м2 в глубине тихой зеленой улицы одного из самых роскошных районов Силиконовой долины, Джарвис узнаёт вас и автоматически предупреждает хозяина о вашем прибытии. Но одна из самых удивительных вещей в том, что после того, как вы войдёте в деревянные ворота вдоль аллеи цитрусовых и кленов Марк выходит лично, чтобы поприветствовать вас.

Здесь нет ничего странного, за исключением того, что он вживую выглядит точно так же, как на бесчисленных фото и видео, вплоть до коротких каштановых волос, серой футболки и джинсов. Требуется некоторое время, чтобы осознать, что это не аватар приветствует вас, стоя у его двери.

На работе последние несколько недель были особенно насыщенным для Цукерберга, который пытается решить три отдельные существенные проблемы: вопросы о том, был ли Facebook главной движущей силой фейковых новостей в преддверии президентских выборов в США; тщательная проверка его связей с венчурным капиталистом (и членом правления Facebook) Марком Андриссеном (Marc Andreessen), после того, как совет взял во внимание просьбу Цукерберга сохранить за ним право контрольного голоса в компании, даже если он продаст большую часть своих акций; а также озабоченность рекламодателей из-за ошибки в Facebook при подсчёте аудитории пользователей, смотрящих видео.

Говорить о чём-то вроде Джарвиса, конечно же, намного проще. Сидя на темно-зеленом диване в своей гостиной со Зверем (Beast), его заплетённой дредами венгерской овчаркой, Цукерберг казался расслабленным, когда объяснял, как система, построенная им за последний год упростила, а иногда и усложнила жизнь для него, Присциллы, и дочери Макс.

В январе, после объявления проекта «Джарвис», Цукерберг написал, что он собирается построить систему, позволяющую ему контролировать с помощью голоса всё, что есть в доме, включая музыку, освещение и температуру. Ему также хотелось, чтобы Джарвис давал возможность друзьям попасть в дом просто распознавая их лица, и предупреждать его, если в комнате Макс происходит что-то, что требует внимания. Он также надеется разработать систему для «визуализации данных в VR, которая поможет ему построить более качественные сервисы и управлять Facebook-структурами ещё эффективней».

Сейчас, в декабре, Марк добился всего этого, за исключением некоторых деталей, касающихся VR. И это работает. Однако, когда он показал систему автору FC, выяснилось, что иногда с ней всё-таки нужно немного повозиться.

Цукерберг начал демонстрацию с бота в Messenger, которого он создал в качестве пользовательского интерфейса системы. Используя свой iPhone, он набрал простые команды включить/выключить свет и убедился, что они работают.

С другой стороны, Марк также построил систему, реагирующую на голосовые команды, с помощью приложения для iOS собственной разработки, но здесь результаты гораздо более противоречивые. Ему пришлось повторить системе четыре раза выключить свет, прежде чем стало темно.

«Ух ты, это самый большой фейл, который когда-либо случался», – сказал Цукерберг смущённо.

Приказ системе воспроизвести музыку был более результативным. «Включи нам музыку», – приказал он, и через пару секунд заиграл David Guetta «Would I Lie to You», – очень тихо, – из колонок в гостиной. «Громче», – сказал он дважды, – уровень звука повысился. Марку также пришлось повторить команду, чтобы остановить воспроизведение, прежде чем наступила тишина.

Одна из особенностей Джарвиса, которой Цукерберг больше всего гордится – это его способность обучаться его личным музыкальным вкусам, а также вкусам Присциллы, поэтому, когда она просит ИИ что-нибудь сыграть, Джарвис выбирает песню, приняв во внимание её предпочтения, а не мужа. В то же время, Марк сконструировал ИИ так, что он может реагировать на запрос определенного стиля музыки: например, лёгкую или семейную, или музыку, похожую на конкретных исполнителей.

«Сыграй что-то вроде Red Hot Chili Peppers», – попросил Цукерберг у Джарвиса. Пару секунд спустя, ИИ врубил в гостиной Nirvana «Smells Like Teen Spirit». «Это достаточно близкая аналогия, как считаешь?» – подытожил он.

Цукербергу также хотелось, чтобы Джарвис в определенной степени понимал лингвистические нюансы. «Когда ты думаешь о музыке, если ты говоришь ему что-нибудь сыграть», –  рассказывает Цукерберг, —  «это может быть песня, это может быть подборка песен, это может быть исполнитель, это может быть альбом, [или] это могут быть рекомендации».

В одном из случаев он обнаружил, что Джарвису становится сложно разобрать очень похожие фразы. Адель прекрасно подойдёт в качестве примера. «Говоришь: сыграй Someone Like You – означает сыграть определенную песню», – поясняет он. «Говоришь сыграть кого-то вроде Адель, – означает просить его найти рекомендации исполнителя, похожего на Адель, и воспроизвести несколько хороших песен в его исполнении. Говоришь: «сыграй что-нибудь из Адель», – это означает «найти некоторые из её лучших песен и создать список воспроизведения».

«И эти фразы: «Кто-то вроде тебя», «кто-то похожий на Адель», и «что-нибудь из Адель» очень похожи, но означают абсолютно разные вещи. Так что имея диапазон способностей выполнять одновременно много разных вещей, не только включить/выключить свет, но быть в состоянии увидеть разницу при получении обратной связи, вот с чем было интересно работать».

«Хороший способ заставить вашу жену злиться на вас»

Добиться правильного жанра музыки для прослушивания – это одно дело. Убедиться, что Джарвис не злит Присциллу – совсем другое.

Даже приказывая системе включить/выключить свет или воспроизвести музыку, можно вызвать удивительное количество неприятностей, если ей не ясно, где она должна это сделать. Например, Цукерберг и его жена иногда используют разные названия для одних и тех же вещей: он говорит «гостиная», а она называет «семейной комнатой». Поэтому Джарвису нужны синонимы для понимания. Но Марк не хотел просто программу, знакомую с разными фразами; научить Джарвиса распознавать их и другие ситуативные нюансы было гораздо более интересной задачей.

«Вы столкнётесь с подобными вещами. Например, я просто скажу «включить свет в этой комнате», а он окажется слишком ярким, поэтому Присцилла скажет «сделай темнее», – говорит Цукерберг. «Но она не сказала в какой комнате сделать темнее, поэтому он должен знать, где мы находимся, и где у нас неподходящая обстановка, и я скажу «включи музыку», а она начнёт играть в комнате Макс, потому что мы были там раньше».

А если Макс спала, когда это произошло? «Это грандиозная неприятность. Это лучший способ, заставить вашу жену злиться на вас».

Еще один пример важности расположения: в рамках своей схемы для создания оптимального впечатления от просмотра телевизора Джарвис может выключить свет. «Одна из комнат, которая примыкает к комнате с телевизором – рабочий кабинет Присциллы, – у нас случалась забавная вещь, когда через некоторое время там, где мы смотрим телевизор, Джарвис просто выключал весь свет на этаже, а она пыталась поработать, и начинала кричать, что-нибудь вроде «МАРК»!

Легче, чем ожидалось. Но…

В то время как Цукерберг обычно выбирает только один ежегодный личный вызов, в 2016 году он выбрал два: второй – пробежать 365 миль. Поэтому при разработке Джарвиса, ему не удавалось долго сидеть на одном месте, как в 2015 году, когда он решил читать одну книгу каждые две недели.

По факту для создания Джарвиса потребовалось меньше времени, чем для выполнения плана по бегу, но во многом за счёт коллекции инструментов Facebook, благодаря которым он стал способень решать такие задачи, как распознавание изображений и голоса.

Чего Марк не ожидал, так это того, что большую часть проекта будет выяснять, как подключить Джарвиса к различным системам в его доме: Creston, домашней автоматической системе фонарей, дверей и температурного контроля; телевизору Samsung; системам безопасности; стриминговой тв-приставке Sonos и Spotify, музыкальному сервису, – к всему тому, что он хотел бы иметь возможность контролировать.

Точнее говоря, домашняя сеть Цукерберга является частью корпоративной инфраструктуры Facebook. Защита требует, чтобы все подключенные к нему устройства имели сертификат безопасности Facebook, по сути – цифровой ключ проверки подлинности, который гарантирует, что указанное устройство безопасно.

Эта особенность вносит свои ограничения на то, что Джарвис мог бы контролировать. Подключенные к интернету холодильники, например, не проходят сертификацию безопасности Facebook. Это не проблема для большинства людей, но большинство людей не Марк Цукерберг. Сохранить безопасность дома было главной проблемой.

Один из способов, который нашёл Цукерберг для безопасного управления отдельными устройствами, были подключённые к интернету переключатели, которые позволили ему для начала включать/выключать электричество. Он хотел, чтобы Джарвис умел готовить тосты на завтрак, используя ломтики хлеба, оставленные в тостере заранее. Но ни один современный тостер не даст вам «зарядить» хлеб, когда тостер выключен, исходя из мер безопасности. Тогда Цукерберг купил простенький тостер 1950-х годов, чтобы иметь возможность готовить тосты с подачей электричества.

В итоге, чтобы соединить всё так, как ему хотелось, потребовались многие часы обратной разработки и программных перехватов, работающих с теми устройствами и сервисами, которые он хотел использовать – и это было ещё до того, как он начал программировать сам ИИ.

Это не готовая система

Несмотря на неспособность Джарвиса работать идеально перед журналистами, Цукерберг гордится тем, чего он добился в этом проекте, и готов сравнить свою работу с системами, доступными любому покупателю, такими как Amazon Echo с виртуальным помошником Alexa и Google Home с Google Assistant.

«Это не готовая система, которая может работать для всех», — подчеркнул Марк. «Но если бы я не смог построить систему, которая сможет делать хотя бы то, что могут Echo и Home, я бы, наверное, очень в себе разочаровался».

Цукерберг поспешил добавить, что создание таких систем, как у Amazon и Google, которые разработаны для того, чтобы позволить миллионам людей контролировать множество устройств — это намного сложнее, чем создание ИИ для отдельно взятого дома, и, что он ни в коей мере не отвергает того, что сделали эти компании. Также нет планов в будущем сделать из этого продукт Facebook.

Но, он отметил: «если бы я не смог улучшить возможности ИИ с музыкальными рекомендациями или систему распознавания лиц, а также понимание системой контекста, когда я хожу по дому, то я бы подумал, что я на самом деле не в состоянии двигать прогресс так сильно».

Цукерберг добавил, что планирует опубликовать результаты своих наработок, и он был бы рад, если бы некоторые из его выводов, в конечном счете, были интегрированы в общедоступные системы. Такой подход отражает общую философию Facebook в плане открытости большей части его работы, особенно в области ИИ.

Одно из таких знаний связано с тем, как мы взаимодействуем с текстом и голосом. Общаться с Джарвисом и заставлять его отвечать имеет смысл при воспроизведении музыки. (В демо Джарвис говорит примитивным синтезированным женским голосом, неотличимым от Siri или Alexa; Морган Фримен еще записывает свои реплики для версии Джарвиса от Цукерберга.) Но Марк посчитал, что в многих других случаях, текстовая версия более подходящая, особенно когда рядом присутствуют другие люди.

«Если я открываю для кого-то ворота, то это никак не относится к тем людям, которые находятся рядом со мной», — говорит он. – «Поэтому я предпочту отдать команду текстом».

Даже если Цукерберг произносит команду, он предпочитает, чтобы Джарвис отвечал ему в письменном виде или «показывал, что происходит, а не произносил вслух», — говорит он. «Потому что, когда ИИ говорит, он требует внимания, и это немного раздражающая вещь».

Тем не менее, есть определенные моменты, когда голос является единственным приемлемым вариантом. «Как только вы сможете заговорить ним, и он сможет ответить, он уже ощущается чем-то гораздо большим – я не хочу сказать, что частью семьи, потому что это уже слишком – но это что-то более олицетворённое, Макс просто обожает его», — говорит Цукерберг.

Цукерберг не питает иллюзий в отношение того, что построенное им менее чем за 150 часов смогло приблизиться к тому, что ИИ-профессионалы Facebook, в том числе некоторые из лучших умов отрасли, могут сделать за тысячу или более часов, а один инженер может выделить год на один проект.

Теперь же, после почти года повсеместной любознательности, Цукерберг довёл Джарвиса до точки, когда он готов показать своё детище миру. Марк продолжит возиться с ИИ, потому что использует его каждый день и всегда найдутся мелкие исправления, которые нужно внести, или понадобиться добавить новые функции. Но Цукерберг очень доволен тем, что он и его семья имеют в своем распоряжении.

«Это здорово, иметь возможность проснувшись утром сказать «доброе утро» или «подъём» и с тобой проснётся весь дом», – говорит он. – «И точно так же, ложась спать в ночное время вместо необходимости всё выключать, просто сказать «спокойной ночи», и в доме всё погаснет, и ты убеждён, что все двери заперты».

Цукерберг, конечно же, не просто муж и отец, пытающийся сделать жизнь своей семьи лучше. Он также глава компании, судьба которой будет зависеть, как и всё остальное, от того насколько эффективно она способна давать возможность техническим специалистам создавать отличные проекты. И одной из лучших вещей в работе над проектом Джарвис стал новый опыт для Цукерберга.

«Я потратил много времени, работая с инструментами Facebook, а в обычных условиях я этого не делаю, будучи генеральным директором компании», – говорит Цукерберг, – «Я чувствую, что получил полноценное ощущение того, как новый инженер приезжает в Facebook и наращивает свой опыт. И так я гораздо выше оцениваю непосредственный опыт работы со всеми этими внутренними инструментами, которые мы создали, и которые являются такой большой частью культуры».

Оригинал статьи: FastCompany