Посунься, ElevenLabs. Корейські дослідники запустили сервіс HierSpeech++, який клонує голоси — поки англійською, але безплатно

Опубликовал
Катерина Даньшина

Випробувати HierSpeech++ можна на Hugging Face або завантажити локально з GitHub.

Для генерації аудіо просто завантажте зразок голосу та текст, який необхідно озвучити.

На цей час інструмент HierSpeech++ доступний лише англійською, однак багатомовну модель планують запустити вже «‎найближчим часом».

Раніше ШІ-стартап ElevenLabs запустив власну послугу клонування голосу, що також дозволяє користувачам генерувати аудіо за допомогою нейромереж на основі завантажених зразків тривалістю кілька хвилин. (Компанія на початку року виклала свою технологію у відкритому доступі, чим одразу скористалися інтернет-троллі — в соцмережах тоді поширювали фейкові голоси знаменитостей, що говорили образливі речі, оголошували війни чи цитували Гітлера).

Disqus Comments Loading...