ДописиСофт Дописи 09.12.2024 о 14:00 comment views icon

Майже професійна озвучка у вас в кишені: тестуємо Elevenlabs

author avatar

Назар ЯворськийПроджектмен

Репутація Ультра | Успішність статті 1066

Майже професійна озвучка у вас в кишені: тестуємо Elevenlabs

Цей матеріал – не редакційнийЦе – особиста думка його автора. Редакція може не розділяти цю думку.

Багато людей чомусь вважають, що технології штучного інтелекту — це бульбашка, по аналогії з хайпом навколо доткомів у 90-х роках. Проте не все так однозначно і нерідко попадаються досить цікаві проєкти, які вже тепер демонструють чудові результати та скоро змінять розклад сил в цілих галузях.

Озвучка тексту у часи динозаврів

Якщо ми повернемося у 2000-ні роки, то вже тоді в програмі ICE Book Reader була можливість озвучити текст за допомогою голосового синтезатора. Я теж намагався експериментувати з цією функцією, але нічого адекватного, що хоч віддалено можна слухати, на жаль, не виходило.

Цілі форуми однодумців мучились цим питанням, підшукували мовні двигуни та софт, підбирали налаштування, щоб правильно встановлювати наголос і т.д. Тоді це так і залишилося іграшкою для гіків, не більше.  

Тестуємо Elevenlabs  Reader – озвучка тексту силами штучного інтелекту

З того часу пройшло вже багато років і ми стоїмо не просто на порозі революції, а вже й бачимо її перші плоди.

Недавно я випадково натрапив на дуже цікавий проєкт, який навіть в безплатному варіанті пропонує нам багато функцій і найголовніше — підтримує українську озвучку.

Тому я хочу поділитися з вами своєю знахідкою, адже її можна використати в багатьох сценаріях.

Розробники з EvenLabs
Розробники з EvenLabs

Компанія ElevenLabs займається тим, що досліджує та реалізовує технології штучного інтелекту для використання в аудіо форматі. Найголовніше, що розробники позиціюють свою роботу, як спробу зробити контент загальнодоступним будь-якою мовою (наразі доступно 32) та будь-яким голосом.

Для нас доступна не тільки вебверсія, а ще й додаток ElevenLabs Reader: AI Audio для основних мобільних платформ: Android та іOS. Раджу вам прямо зараз перевірити на що він здатний, я впевнений, результат вас здивує.

Дана технологія використовується для озвучування аудіокниг і новинних статей, анімації персонажів відеоігор, допомагає у підготовці до виробництва фільмів, локалізації медіа в розвагах, створення динамічного аудіовмісту для соціальних мереж і реклами.

Якщо у вас немає дорогого мікрофона та гарно поставленого голосу ви можете замінити свій голос без жодних проблем.

Але спробуймо спочатку перевірити, як працює вебверсія. Для цього використаємо фрагмент з роману Стівена Кінга: Мертва зона.

Як по мені результат досить непоганий, можна погратися з голосами та підібрати найбільш приємний для себе.

Також прекрасно працює функція “мова до мови”, яка дозволяє змінити свій голос, що записаний через свій мікрофон та конвертувати його силами ШІ в голос іншого персонажа. Нижче я продемонструю, як це працює, зачитавши уривок з Володаря Перснів. Причому мікрофон у мене жахливий, він вбудований у веб-камеру 14-літньої давності. Але так навіть краще, адже можна уловити контраст.

Якщо використовувати хоча б мікрофон зі смартфона середнього класу, то, як по мені, скоро повністю відпаде потреба в професійній озвучці.

І наостанок, подивімось, як працює мобільний додаток.

Так, іноді програма все ще помиляється з наголосами та інтонацією. Але я вважаю, що навіть тепер в такому вигляді її можна використовувати, а це лиш початок. Що буде через рік-два?

Задля експерименту по зміні голосу, ще 2 місяці тому я зробив аудіоверсію ностальгічного допису:

«Домашній ПК» та комп’ютерні журнали 2000-х. Раніше було краще?

Нічого особистого, просто бізнес

На жаль, компанію ElevenLabs  абсолютно не цікавить співпраця з українським медіапростором.  В мене була ідея прикріпляти аудіоверсії до всіх класних дописів учасників спільноти IT Community. На пропозицію партнерства від ITC представник маркетингового відділу максимально обтікаємо Warmly побажала “хорошого настрою і здоров’я”. 

Висновок

Хоча результат роботи ШІ все ще не ідеальний, але розробникам залишилось підтягнути буквально декілька відсотків у випадках з наголосами. Тоді студії озвучки можна буде відправляти на пенсію. Надалі ми самі вибиратимемо голоси, якими б хотіли слухати той чи інший текст, книгу або дубляж фільму. І це вже не далеке майбутнє, а майже сьогодення.

Ложкою бочкою дьогтю в цьому проєкті — це ціна підписки. Наприклад, для створення однієї аудіокниги вам прийдеться витратити приблизно 100$, зміна голосу у 20-хвилинному ролику обходиться десь в 400 гривень. Розробники спішать швиденько заробити на своєму продукті, доки ще є час, адже скоро з’являться безплатні альтернативи не гіршої якості.

Можливо вам зустрічалися якісніші проєкти? Напишіть у коментарях.

 

Цей матеріал – не редакційнийЦе – особиста думка його автора. Редакція може не розділяти цю думку.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: