Исследователи из Вашингтонского университета разработали первые в мире беспроводные наушники с крошечными камерами.
Разработчики отмечают, что эти наушники позволят пользователям общаться с ИИ относительно того, что они видят. Например, можно обратиться к искусственному интеллекту и попросить его перевести что-то непонятное пользователю на иностранном языке.
Прототип системы под названием VueBuds делает черно-белые снимки низкого разрешения, которые по Bluetooth передаются на смартфон или другое устройство. Небольшая модель ИИ отвечает на вопросы касательного того, что на фото. Для сохранения конфиденциальности обработка производится на самом устройстве. Крошечный индикатор сигнализирует о ведении записи. Пользователи также могут сразу удалить изображение. Разработка была представлена на конференции CHI 2026 в Барселоне.
«Мы не видим, чтобы большинство людей использовали умные очки или VR-гарнитуры, отчасти потому, что многим не нравится носить очки, и это часто вызывает опасения по поводу конфиденциальности, например, при записи видео высокого разрешения и ее обработке в облаке», — отмечает ведущий автор исследования, профессор Школы компьютерных наук и инженерии им. Пола Г. Аллена Шьям Голлакота.
Однако, по его словам, почти все используют наушники. Поэтому исследователи хотели проверить, можно ли в них интегрировать ИИ для обработки изображений и одновременно гарантировать конфиденциальность.
Поскольку камеры потребляют значительно больше энергии, чем микрофоны, использование камер с высоким разрешением не рассматривалось. Кроме этого возникла проблема с передачей больших объемов информации через Bluetooth. Таким образом система не могла бы непрерывно транслировать видео.
Разработчики убедились, что использование крошечных камер с низким разрешением для черно-белых фото ограничивает расход заряда батареи и обеспечивает приемлемую передачу данных через Bluetooth. Исследователи также установили, что наклон каждой камеры на 5-10° наружу обеспечивает поле зрения 98-108°. Вследствие этого возникает определенная слепая зона в случае, когда объекты находятся на расстоянии менее 20 см от пользователей, однако люди редко когда держат объекты настолько близко, когда рассматривают их.
Хотя модель ИИ могла распознавать изображения с каждого наушника, обработка изображений с обоих наушников замедляла ее работу. Поэтому модели было предложено объединять 2 изображения в одно. Это позволяет очень быстро реагировать, чтобы пользователями это воспринималось как взаимодействие в режиме реального времени.
В ряде тестов 74 добровольца сравнивали записанные данные, полученные с помощью VueBuds с фото, сделанными с помощью очков Ray-Ban Meta Glasses. Несмотря на использование VueBuds изображений низкого разрешения с более строгим контролем конфиденциальности, а Ray-Ban — изображений высокого разрешения с обработкой в облаке, обе системы продемонстрировали одинаковые результаты.
Добровольцы предпочитали качество перевода, сделанного VueBuds, тогда как Ray-Ban лучше справлялись с подсчетом объектов. 16 участников также проверяли способность системы к качественному переводу и идентификации объектов. Точность перевода с помощью VueBuds составила 83-84%, а определение автора и названия книги — 93%.
Целью исследователей было оценить целесообразность интеграции камер в беспроводные наушники. Поскольку система обрабатывает только черно-белые фото, она не способна отвечать на вопросы, связанные с цветами. Разработчики хотят добавить возможность обработки цветных фото и научить специализированные модели ИИ качественному переводу.
Ранее мы писали, что Google начала постепенно запускать новую функцию для YouTube — создание ИИ-аватаров, которые воспроизводят внешность и голос пользователя в коротких видео Shorts Ulefone представила на MWC 2026 RugOne со съемной камерой и аккумулятором на 9000 мА·ч.
Результаты исследования представлены в выводах конференции CHI 2026.
Источник: TechXplore

Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: