Рубрики Новости

Робот-пылесос Roomba j7 от iRobot сфотографировал женщину в туалете для обучения искусственного интеллекта. Снимки «убежали» в Facebook

Опубликовал
Катерина Даньшина

Изображения, сделанные роботом-пылесосом Roomba j7 от iRobot, направили в Scale AI – стартап, занимающийся маркировкой аудио-, фото- и видеоданных для обучения искусственного интеллекта. Впоследствии 15 фото (включая снимок, где женщина сидит на унитазе со спущенными шортами) каким-то образом оказались в закрытых группах некоторых соцсетей.

Другие фото показывают комнаты домов, людей и домашних животных. Мебель, декор и предметы, расположенные высоко на стенах и потолках, сопровождаются метками типа «телевизор», «растение» и «светильник».

iRobot – крупнейший в мире поставщик роботизированных пылесосов, которого Amazon хочет приобрести за 1,7 миллиарда долларов – подтвердил, что эти изображения были сделаны его моделями Roomba в 2020 году. Все они поступили от «спецустройств, непредназначенных для обычного пользователя», а были переданы тестировщикам и сотрудникам, которые официально согласовали отправку собственных данных через роботов.

Java developer.
Java developer: підготуємо вас до карʼєри в IT з нуля. Допоможемо з працевлаштуванням!
Зареєструватись на курс

По словам iRobot, устройства были обозначены ярко-зеленой наклейкой с надписью «Идет видеозапись», и тестировщики могли удалить все, что сочтут конфиденциальным.

15 «сбежавших» изображений — лишь фрагмент масштабной экосистемы данных. В iRobot заявляют, что поделились более чем 2 миллионами изображений с Scale AI и еще неизвестным количеством с другими платформами аннотаций данных.

Джеймс Бауссманн, спикер iRobot, сообщил в электронном письме, что компания «приняла меры предосторожности, чтобы гарантировать, что персональные данные обрабатываются безопасно и в соответствии с действующим законодательством», и отметил, что изображения были «распространены с нарушением правил соглашения о неразглашении между iRobot и поставщиком услуг аннотаций изображений». Позже генеральный директор iRobot Колин Энгл сказал, что «iRobot прекращает свои отношения с поставщиком услуг, который слил изображения».

Однако, в конце концов, этот набор изображений представляет нечто большее, чем действия любой отдельной компании. Он говорит о распространенной практике обмена потенциально конфиденциальными данными для обучения алгоритмов, а также об удивительном путешествии, которое может совершить одно изображение — в этом случае из домов в Северной Америке, Европе и Азии на серверы iRobot из штата Массачусетс, оттуда в Scale AI из Сан -Франциско и, наконец, к сотрудникам Scale, работающим по контракту с обработкой данных во всем мире (включая, в этом случае, работников из Венесуэлы, разместивших изображения в частных группах в Facebook, Discord и других местах).

Эволюция роботов-пылесосов

Роботы-пылесосы не всегда были такими умными. Самая первая модель, от шведского производства Electrolux Trilobite, вышла на рынок в 2001 году. Она использовала ультразвуковые датчики для определения местоположения стен и дополнительные датчики ударов или обрывов во избежание наездов на предметы или падения с лестницы. Датчики не всегда правильно срабатывали и уборка была далека от идеальной.

В 2002-м iRobot выпустил первое поколение Roomba, опирающееся на аналогичные базовые датчики ударов и поворотов. Модель была гораздо дешевле чем у конкурента, и стала первым коммерчески успешным роботом-пылесосом.

По данным Strategy Analytics только в 2021 году в Европе и Америке было продано около 23,4 миллиона роботов-пылесосов.

Базовые модели сегодня работают в основном одинаково, тогда как пылесосы среднего класса получают лучшие датчики и другие навигационные методы, такие как одновременная локализация и картографирование, чтобы наметить лучшие пути для уборки. Устройства высшего класса начали использовать компьютерное зрение: сюда входят iRobot (продавшая более 40 миллионов устройств с 2002 года), Ecovacs, Roborock, Samsung, LG и Dyson.

«Компьютерное зрение позволяет роботу видеть все богатство окружающего мира. Это позволяет устройствам iRobot избегать шнуров на полу или понимать, что впереди, например, диван», — говорит Крис Джонс, главный технический директор iRobot.

Откуда роботы берут данные

Чтобы компьютерное зрение в роботах-пылесосах действительно работало по назначению, производителям нужно учить его на высококачественных наборах данных. Сайт MIT Technology Review пообщался с 12 компаниями, продающими роботизированные пылесосы, или направил им запросы и обнаружил, что те по-разному реагируют на задачи сбора учебных данных.

В случае с iRobot более 95% набора данных изображений поступает из реальных домов, жители которых являются либо сотрудниками iRobot, либо волонтерами, нанятыми сторонними поставщиками данных. Компания также предлагает обычным потребителям предоставлять обучающие данные через свое приложение для усовершенствования алгоритмов.

Roborock сказал, что: либо «производит изображения в собственных лабораториях», либо «работает со сторонними поставщиками в Китае, которых специально просят снимать и предоставлять изображения объектов». Между тем, Dyson, которая продает две модели высококачественных роботов-пылесосов, заявила, что собирает данные от «тестировщиков в отделе исследований и разработок» и со сгенерированных искусственным интеллектом учебных баз данных.

Большинство компаний прямо сказали, что не используют данные клиентов для своих алгоритмов машинного обучения. Samsung, LG и Bosch не ответили на запросы о комментариях, в то время как Ecovacs называет источник своих обучающих данных «конфиденциальным».

Подсказки по другим методам сбора предоставил хакер Гизе, изучавший роботов-пылесосов Dreame, относительно новой китайской компании. Он обнаружил в моделях папку с отметкой «AI server», а также функции загрузки изображений.

«Компании часто говорят, что «данные камеры никогда не посылаются в облако», но когда я получил доступ к устройству, то смог доказать, что это неправда. Даже если они действительно не загружали ни одной фотографии, эта функция доступна», — говорит Гизе.

Центры аннотации данных

По прогнозам, рыночная стоимость услуги аннотации данных достигнет 13,3 миллиарда долларов США к 2030 году. Эта отрасль в значительной степени развилась, чтобы удовлетворить огромную потребность в маркированных данных для обучения алгоритмов, использующихся в беспилотных автомобилях.

Работники компаний по маркировке данных проводят ручную классификацию, улучшают программное обеспечение для распознавания голоса, транскрибируя низкокачественный звук, и помогают роботам-пылесосам распознавать объект и видео.

Среди множества стартапов, появившихся в последнее десятилетие, Scale AI стала лидером рынка. Основанная в 2016 году компания построила бизнес-модель, заключая контракты с удаленными работниками в бедных странах на основе задач на Remotasks, собственной платформе краудсорсинга.

iRobot подтвердил, что 15 изображений, опубликованных в соцсетях, поступили из его устройств, предоставив электронную таблицу с перечнем конкретных дат их создания (с июня по ноябрь 2020 года), стран, из которых они происходят (США, Япония, Франция, Германия и Испания. ), а также серийными номерами устройств, создавших изображения и примечания с указанием того, что форма согласия подписана пользователем каждого устройства.

iRobot утверждает, что распространение изображений в группах социальных сетей нарушает соглашения Scale с ней, а Scale говорит, что контрактные работники, поделившиеся изображениями, нарушили свои собственные соглашения.

Компании в большинстве своем пытаются избегать фото с обнаженными людьми, и вообще скрывать их лица на любых снимках. В случае с женщиной на унитазе, на ее лице был черный круг. Но на других изображениях с людьми их личности не скрывались.

Возможно, на это согласились и вы

В политике конфиденциальности iRobot указано, что он собирает аудиовизуальные данные, только если человек делится изображениями через мобильное приложение.

В политике конфиденциальности LG по Hom-Bot Turbo+ с поддержкой камеры и искусственного интеллекта объясняется, что его программа собирает данные, включая «аудио, электронную, визуальную или подобную информацию, такую как фотографии профиля, записи голоса и видео». А политика конфиденциальности для Jet Bot AI+ Robot Vacuum от Samsung и Powerbot R7070 с камерами, будет собирать «хранящуюся на устройстве информацию, такую как фотографии, контакты, текстовые журналы, сенсорные взаимодействия, настройки и записи голосовых команд».

Между тем, в политике конфиденциальности Roborock не упоминаются аудиовизуальные данные, хотя представители компании сообщили MIT Technology Review, что потребители в Китае могут поделиться ими.

Соучредитель iRobot Хелен Грейнер подчеркивает, что, собирая все эти данные, компании не пытаются нарушить конфиденциальность своих клиентов.

«Они просто пытаются создавать лучшие продукты — или, в случае iRobot, сделать более качественной уборку».

Со всем тем, даже самые лучшие побуждения таких компаний, как iRobot, явно оставляют пробелы в защите конфиденциальности.

Что дальше?

Аппетит к данным будет только расти в последующие годы. Пылесосы – это лишь крохотная часть умных устройств, которые распространяются в нашей жизни. Эта большая миссия замечается в том, что аннотаторы данных Scale обозначали не только предметы на полу, которых следует избегать (функция, рекламируемая iRobot), а такие предметы, как «шкаф», «кухонный стол» и «полку».

Компании, производящие роботизированные пылесосы, уже инвестируют в другие функции и устройства, которые приблизят нас к будущему с роботами. Последними Roomba можно управлять голосом через Nest и Alexa и они распознают более 80 различных объектов в доме. Тем временем робот-пылесос Deebot X1 от Ecovacs интегрировал собственную голосовую помощь, а Samsung является одной из нескольких компаний, разрабатывающих «роботов-компаньонов». Компания Miele, продающая RX2 Scout Home Vision, сосредоточилась на умной духовке с камерой.

И если приобретение iRobot компанией Amazon за 1,7 миллиарда долларов реализуется до конца (ныне ожидается одобрение FTC), Roomba, вероятно, еще больше интегрируется в видение умного дома от Amazon. И тогда, нам следует осторожнее относиться к техновинкам в своем доме, или по крайней мере внимательнее читать политику конфиденциальности.

Источник: MIT Technology Review

Disqus Comments Loading...