Рубрики Блоги

Нейросеть научили подделывать голоса

Опубликовал
Кирилл Иртлач

Эра дипфейков настает не только для изображений, видео и текстов: стартап из Массачусетса Modulate.ai разработал нейросеть, способную сделать голос моложе или сменить пол спикера. Проверить ее на практике взялись журналисты MIT Technology Review. Обозреватель Уилл Найт прочитал стихотворение Уильяма Блейка «Тигр», а нейросеть превратила его голос в женский.

«Акцент, ударения, интонации — все это мое. Однако «звучу» я, словно девушка с высоким голосом», — констатирует журналист.

На сайте Modulate можно послушать, как технологию рекламирует «Барак Обама». Однако таким образом не оценить одно из главных достижений стартапа: нейросеть способна преобразовывать речь в реальном времени.

Испытав работу алгоритма в звукоизолированной комнате, Найт отметил, что на первых порах в сгенерированном нейросетью голосе чувствуется искусственность («дрожание»). Но чем больше он говорил — тем лучше становился результат.

Глава Modulate Майк Паппас утверждает, что стартап не ставит целью подделывать голоса знаменитостей — как это нередко происходит с видео. По его мнению, в первую очередь технология найдет применение в многопользовательских играх — в них «искусственный голос» станет частью имиджа игрока и добавит атмосферы, а также убережет детей и «чувствительных девушек» от грубых нападок.

Онлайн-курс "Комунікаційний менеджер" від Skvot.
Ви отримаєте скіли комунікації, сформуєте CV та розробите власну one page strategy. Для своєї карʼєри та успішного масштабування бренду.
Програма курсу і реєстрація

«Наша разработка не призвана вводить в заблуждение. С ее помощью мы намерены открыть перед людьми новые возможности», — подчеркивает Паппас.

Профессор Чарльз Сэйф из Университета Нью-Йорка, изучающий распространение дезинформации, отметил, что технология Modulate гораздо более реалистична, чем другие современные решения по изменению голоса. Исследователь предупреждает, что в перспективе ИИ фундаментально изменит саму суть информации:

«Нам придется задуматься о том, что есть реальность».

Паппас, напротив, уверен, что технические и юридические инструменты позволят удержать использование технологии в рамках. Кроме того, добавляет он, Modulate будет встраивать в генерируемые звуковые дорожки своеобразные «водяные знаки», указывающие на их искусственный характер.

Источник: hightech.plus

Disqus Comments Loading...