Рубрики Новини

Робот-пилосос Roomba j7 від iRobot сфотографував жінку в туалеті для навчання штучного інтелекту. Згодом знімки “втекли” у Facebook

Опубликовал
Катерина Даньшина

Зображення, зроблені роботом-пилососом Roomba j7 від iRobot, надійшли до Scale AI — стартапу, що займається маркуванням аудіо-, фото- та відеоданих для навчання штучного інтелекту. Згодом 15 фото (включно зі знімком, де жінка сидить на унітазі зі спущеними шортами) якимось чином опинились у закритих групах деяких соцмереж. 

Інші фото демонструють кімнати будинків, людей і домашніх тварин. Меблі, декор і предмети, розташовані високо на стінах і стелях, супроводжуються мітками на кшталт “телевізор”, “рослина” та “світильник”.

iRobot — найбільший у світі постачальник роботизованих пилотягів, якого Amazon хоче придбати за 1,7 мільярда доларів — підтвердив, що ці зображення були зроблені його моделями Roomba у 2020 році. Усі вони надійшли від “спецпристроїв, які не призначені для звичайного користувача”, а були передані тестувальникам та співробітникам, які офіційно погодили надсилання власних даних через роботів.

Курс-професія "Web Design" від Skvot.
Для тих, хто давно хоче опанувати професію вебдизайнера, але не знає, з чого почати.Після 4 місяців навчання — старт в карʼєрі з двома кейсами у портфоліо.
Програма курсу і реєстрація

За словами iRobot, пристрої були позначені яскраво-зеленою наклейкою з написом “Триває відеозапис”, і тестувальники мали змогу видалити усе, що вважали конфіденційним.

15 зображень, що “втекли” у мережу — лише фрагмент масштабної екосистеми даних. В iRobot заявляють, що поділилися понад 2 мільйонами зображень із Scale AI та ще невідомою кількістю з іншими платформами анотацій даних.

Джеймс Бауссманн, речник iRobot, повідомив в електронному листі, що компанія “вжила запобіжних заходів, щоб гарантувати, що персональні дані обробляються безпечно та відповідно до чинного законодавства”, і зазначив, що зображення були “розповсюджені з порушенням правил угоди про нерозголошення між iRobot і постачальником послуг анотацій зображень”. Пізніше генеральний директор iRobot Колін Енгл сказав, що “iRobot припиняє свої відносини з постачальником послуг, який злив зображення”. 

Однак, зрештою, цей набір зображень представляє щось більше, ніж дії будь-якої окремої компанії. Він говорить про поширену практику обміну потенційно конфіденційними даними для навчання алгоритмів, а також про дивовижну подорож, яку може здійснити одне зображення — у цьому випадку з домівок у Північній Америці, Європі та Азії до серверів iRobot зі штату Массачусетс, звідти до Scale AI із Сан-Франциско та, нарешті, до співробітників Scale, які працюють за контрактом з обробкою даних у всьому світі (включаючи, у цьому випадку, працівників із Венесуели, які розмістили зображення в приватних групах у Facebook, Discord та інших місцях).

Еволюція роботів-пилососів

Роботи-пилососи не завжди були такими розумними. Найперша модель, від шведського виробництва Electrolux Trilobite, вийшла на ринок у 2001 році. Вона використовувала ультразвукові датчики для визначення місцезнаходження стін і додаткові датчики ударів чи обривів, щоб уникнути наїздів на предмети або падіння зі сходів. Датчики не завжди правильно спрацьовували і прибирання було далеким від ідеального. 

У 2002-му iRobot випустив перше покоління Roomba, які спиралися на аналогічні базові датчики ударів і поворотів. Набагато дешевший за свого конкурента, він став першим комерційно успішним роботом-пилососом.

Базові моделі сьогодні працюють здебільшого однаково, тоді як пилотяги середнього класу мають кращі датчики та інші навігаційні методи, такі як одночасна локалізація та картографування, щоб намітити кращі шляхи для прибирання. Пристрої вищого класу почали використовувати комп’ютерний зір: сюди входять iRobot (яка продала понад 40 мільйонів пристроїв з 2002 року), Ecovacs, Roborock, Samsung, LG і Dyson. 

За даними Strategy Analytics лише у 2021 році в Європі та Америці було продано близько 23,4 мільйона роботів-пилососів

“Комп’ютерний зір дозволяє роботу бачити все багатство навколишнього світу. Це дозволяє пристроям iRobot уникати шнурів на підлозі або розуміти, що попереду, наприклад диван”, — каже Кріс Джонс, головний технічний директор iRobot.

Звідки роботи беруть дані

Щоб комп’ютерний зір у роботах-пилососах справді працював за призначенням, виробникам потрібно вчити його на високоякісних різноманітних наборах даних. Сайт MIT Technology Review поспілкувався з 12 компаніями, які продають роботизовані пилотяги, або надіслав їм запити та виявив, що ті по-різному реагують на завдання збору навчальних даних. 

У випадку з iRobot, понад 95% набору даних зображень надходить із реальних будинків, мешканці яких є або співробітниками iRobot, або волонтерами, найнятими сторонніми постачальниками даних. Компанія також пропонує звичайним споживачам надавати навчальні дані через свій застосунок для вдосконалення алгоритмів. 

Roborock сказав, що або “виробляє зображення у власних лабораторіях”, або “працює зі сторонніми постачальниками в Китаї, яких спеціально просять знімати та надавати зображення об’єктів”. Тим часом Dyson, яка продає дві моделі високоякісних роботів-пилососів, заявила, що збирає дані від “тестувальників у відділі досліджень і розробок” та зі згенерованих штучним інтелектом навчальних баз даних.

Більшість компаній прямо сказали, що не використовують дані клієнтів для навчання своїх алгоритмів машинного навчання. Samsung, LG і Bosch не відповіли на запити про коментарі, тоді як Ecovacs називає джерело своїх навчальних даних “конфіденційним”.

Підказки щодо інших методів збору надав хакер Гізе, який вивчав роботів-пилососів Dreame, відносно нової китайської компанії. Він виявив у моделях теку з позначкою “AI server”, а також функції завантаження зображень. 

“Компанії часто кажуть, що “дані камери ніколи не надсилаються в хмару”, але коли я отримав доступ до пристрою, то зміг довести, що це неправда. Навіть якщо вони насправді не завантажували жодної фотографії, ця функція доступна”, — каже Гізе.

Центри анотації даних

За прогнозами ринкова вартість послуги анотації даних досягне 13,3 мільярда доларів США до 2030 року. Ця галузь значною мірою розвинулася, щоб задовольнити величезну потребу у маркованих даних для навчання алгоритмів, які використовуються в безпілотних автомобілях. 

Працівники компаній з маркування даних проводять ручну класифікацію, покращують програмне забезпечення для розпізнавання голосу, транскрибуючи низькоякісний звук, і допомагають роботам-пилососам розпізнавати об’єкти, позначаючи фотографії та відео.

Серед безлічі стартапів, які з’явилися за останнє десятиліття, Scale AI стала лідером ринку. Заснована у 2016 році компанія побудувала бізнес-модель, укладаючи контракти з віддаленими працівниками в бідних країнах на основі завдань на Remotasks, власній платформі краудсорсингу.

iRobot підтвердив, що 15 зображень, опублікованих у соцмережах, надійшли з його пристроїв, надавши електронну таблицю з переліком конкретних дат їх створення (з червня по листопад 2020 року), країн, з яких вони походять (США, Японія, Франція, Німеччина та Іспанія), а також серійні номери пристроїв, які створили зображення та примітки із зазначенням того, що форма згоди підписана користувачем кожного пристрою. 

iRobot стверджує, що поширення зображень у групах соціальних мереж порушує угоди Scale з нею, а Scale каже, що контрактні працівники, які поділилися зображеннями, порушили свої власні угоди.

Компанії здебільшого намагаються уникати фото з оголеними людьми, та загалом приховувати їх обличчя на будь-яких знімках. У випадку з жінкою на унітазі, на її обличчі був “чорний круг”. Але на інших зображеннях з людьми їх особистості не приховувались.

Можливо, на це погодилися і ви

У політиці конфіденційності iRobot зазначено, що він збирає аудіовізуальні дані, лише якщо особа ділиться зображеннями через свій мобільний застосунок.

У політиці конфіденційності LG щодо Hom-Bot Turbo+ із підтримкою камери та штучного інтелекту пояснюється, що його програма збирає дані, включаючи “аудіо, електронну, візуальну чи подібну інформацію, таку як фотографії профілю, записи голосу та відео”. А політика конфіденційності для Jet Bot AI+ Robot Vacuum від Samsung і Powerbot R7070, які мають камери, збиратиме “інформацію, яку ви зберігаєте на своєму пристрої, таку як фотографії, контакти, текстові журнали, сенсорні взаємодії, налаштування та записи ваших голосових команд”. 

Тим часом у політиці конфіденційності Roborock не згадуються аудіовізуальні дані, хоча представники компанії повідомили MIT Technology Review, що споживачі в Китаї мають можливість поділитися ними.

Співзасновник iRobot Хелен Грейнер підкреслює, що, збираючи всі ці дані, компанії не намагаються порушити конфіденційність своїх клієнтів. 

“Вони просто намагаються створювати кращі продукти — або, у випадку iRobot, зробити кращим прибирання”.

З усім тим, навіть найкращі зусилля таких компаній, як iRobot, явно залишають прогалини в захисті конфіденційності. 

Що далі?

Апетит до даних лише зростатиме в наступні роки. Пилотяги — це лише крихітна частина розумних пристроїв, які поширюються в нашому житті. Ця більша місія помічається в тому, що анотатори даних Scale позначали не лише предмети на підлозі, яких слід уникати (функція, яку рекламує iRobot), а такі предмети, як “шафу”, “кухонний стіл” та “полицю”.

Компанії, що виробляють роботизовані пилотяги, вже інвестують в інші функції та пристрої, які наблизять нас до майбутнього з роботами. Останніми Roomba можна керувати голосом через Nest і Alexa, і вони розпізнають понад 80 різних об’єктів у домі. Тим часом робот-пилосос Deebot X1 від Ecovacs інтегрував власну голосову допомогу, а Samsung є однією з кількох компаній, що розробляють “роботів-компаньйонів”. Компанія Miele, яка продає RX2 Scout Home Vision, зосередилася на розумній духовці з камерою.

І якщо придбання iRobot компанією Amazon за 1,7 мільярда доларів реалізується до кінця (нині очікується схвалення FTC), Roomba, ймовірно, ще більше інтегруються в бачення розумного дому від Amazon. І тоді, нам слід обережніше ставитися до техноновинок у своєму будинку, або принаймні уважніше читати політику конфіденційності. 

Джерело: MIT Technology Review

Disqus Comments Loading...