Випробувати HierSpeech++ можна на Hugging Face або завантажити локально з GitHub.
Для генерації аудіо просто завантажте зразок голосу та текст, який необхідно озвучити.
На цей час інструмент HierSpeech++ доступний лише англійською, однак багатомовну модель планують запустити вже «найближчим часом».
Раніше ШІ-стартап ElevenLabs запустив власну послугу клонування голосу, що також дозволяє користувачам генерувати аудіо за допомогою нейромереж на основі завантажених зразків тривалістю кілька хвилин. (Компанія на початку року виклала свою технологію у відкритому доступі, чим одразу скористалися інтернет-троллі — в соцмережах тоді поширювали фейкові голоси знаменитостей, що говорили образливі речі, оголошували війни чи цитували Гітлера).
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.