Опробовать HierSpeech++ можно на Hugging Face или скачать локально с GitHub.
Для создания аудио просто загрузите образец голоса и текст, который необходимо озвучить.
В настоящее время инструмент HierSpeech++ доступен только на английском, однако многоязычную модель планируют запустить уже в ближайшее время.
Ранее ИИ-стартап ElevenLabs запустил собственную услугу клонирования голоса, что также позволяет генерировать аудио с помощью нейросетей на основе загруженных образцов длительностью несколько минут. (Компания в начале года выложила свою технологию в открытом доступе, чем сразу воспользовались интернет-тролли — в соцсетях распространяли тогда фейковые голоса знаменитостей, которые говорили обидные вещи, объявляли войны или цитировали Гитлера).