Новости WTF 05.06.2023 в 12:34 comment views icon

Слепая камера на базе Raspberry Pi создает «фото» с помощью ИИ на основе окружающих звуков

author avatar
https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/11/photo_2023-11-12_18-48-05-3-96x96.jpg

Андрей Русанов

Автор сайта

Слепая камера на базе Raspberry Pi создает «фото» с помощью ИИ на основе окружающих звуков

Если камеры, «фотографирующей» по данным о местоположении вам недостаточно – то вот «фотоаппарат», генерирующий изображение на основе звуков. Разработчик Диего Трухильо Писанти создал на базе Raspberry Pi слепую камеру, в качестве данных для «фото» использующей окружающие звуки.

Чтобы получить изображение, достаточно навести звукоуловитель аппарата на объект и нажать кнопку. Искусственный интеллект распознает обстановку и выдаст результат. Специально для этого проекта Писанти разработал собственную модель нейронной сети, которую обучил на видеороликах, снятых в Мехико. Чем уникальнее звук – тем лучше выходит «фото».

 

Для обучения модели использовались все кадры видео и последняя секунда аудио. Таким образом были созданы ассоциативные ряды, привязанные к местности. Отсюда следует ограничение модели: все воссозданные изображения будут напоминать столицу Мексики. Впрочем, дальнейшее обучение способно расширить географию.

Для создания камеры использован модуль Raspberry Pi 3B, но можно взять и Raspberry Pi 4. На компьютере работает софт Tensorflow. Камера также имеет небольшой экран-«видоискатель», позволяющий следить за процессом создания изображений и видеть результат. Корпус и звукоуловитель напечатаны  на 3D-принтере.

Онлайн-курс "React Native Developer" від robot_dreams.
Опануйте кросплатформну розробку на React Native та навчіться створювати повноцінні застосунки для iOS та Android.
Програма курсу і реєстрація

Модель ИИ, используемая для обучения слепой камеры, создана с использованием Python 3. Она предназначена для работы с Tensorflow 2 и запускается на Raspberry Pi с использованием TFLite. Подробнее о проекте можно узнать на сайте создателя.

ИИ-модель NVIDIA Neuralangelo способна создавать 3D-объекты из 2D-видео

Источник: Tom’s Hardware


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: