Блоги Блоги 01.03.2019 в 13:41 comment

Нейросеть научили подделывать голоса

author avatar
https://secure.gravatar.com/avatar/341ba260d57a6855744e3c0760decc30?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/341ba260d57a6855744e3c0760decc30?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

Эра дипфейков настает не только для изображений, видео и текстов: стартап из Массачусетса Modulate.ai разработал нейросеть, способную сделать голос моложе или сменить пол спикера. Проверить ее на практике взялись журналисты MIT Technology Review. Обозреватель Уилл Найт прочитал стихотворение Уильяма Блейка «Тигр», а нейросеть превратила его голос в женский.

«Акцент, ударения, интонации — все это мое. Однако «звучу» я, словно девушка с высоким голосом», — констатирует журналист.

На сайте Modulate можно послушать, как технологию рекламирует «Барак Обама». Однако таким образом не оценить одно из главных достижений стартапа: нейросеть способна преобразовывать речь в реальном времени.

Испытав работу алгоритма в звукоизолированной комнате, Найт отметил, что на первых порах в сгенерированном нейросетью голосе чувствуется искусственность («дрожание»). Но чем больше он говорил — тем лучше становился результат.

Глава Modulate Майк Паппас утверждает, что стартап не ставит целью подделывать голоса знаменитостей — как это нередко происходит с видео. По его мнению, в первую очередь технология найдет применение в многопользовательских играх — в них «искусственный голос» станет частью имиджа игрока и добавит атмосферы, а также убережет детей и «чувствительных девушек» от грубых нападок.

«Наша разработка не призвана вводить в заблуждение. С ее помощью мы намерены открыть перед людьми новые возможности», — подчеркивает Паппас.

Кіноклуб "Забагато драми" від Skvot.
10 лекцій та 10 практикумів, щоб зрозуміти мистецтво кіномови.Сформуй власний смак та бібліотеку фільмів і навчись писати рецензії.
Програма кіноклубу

Профессор Чарльз Сэйф из Университета Нью-Йорка, изучающий распространение дезинформации, отметил, что технология Modulate гораздо более реалистична, чем другие современные решения по изменению голоса. Исследователь предупреждает, что в перспективе ИИ фундаментально изменит саму суть информации:

«Нам придется задуматься о том, что есть реальность».

Паппас, напротив, уверен, что технические и юридические инструменты позволят удержать использование технологии в рамках. Кроме того, добавляет он, Modulate будет встраивать в генерируемые звуковые дорожки своеобразные «водяные знаки», указывающие на их искусственный характер.

Источник: hightech.plus


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: