Функція Personal Voice в iOS 17 — техноблогер Маркес Браунлі показав ШІ-клонування голосу в дії. Результат приголомшує і лякає водночас

Опубликовал
Володимир Скрипін

Одна з ключових нових функцій iOS 17 — Personal Voice, клонування та використання «копії» голосу користувача для озвучення повідомлень під час дзвінків iPhone. Відомий ютубер та техноблогер Маркес Браунлі (він же MKBHD) вже встиг її протестувати та поділився своїми враженнями в короткому відео, яке дозволяє оцінити функціональність в дії.

Як працює клонування голосу Personal Voice в iOS 17

Personal Voice («Персональний голос») — одна із пакета нових функцій доступності для людей з порушеннями зору, слуху та когнітивних здібностей, які Apple вперше анонсувала у травні. Вона синтезує мову на основі голосу користувача та призначена насамперед для тих, хто ризикує втратити здатність розмовляти через хворобу. Для створення «копії» власного голосу потрібно записати через вбудований мікрофон референс — протягом 15 хвилин зачитувати вголос рандомізовані текстові підказки. Функція спирається на алгоритми машинного навчання та інтегрується з Live Speech («Жива мова»), іншою системною функцією (працюватиме на всіх пристроях Apple) для озвучування попередньо набраного тексту під час дзвінка Face Time чи голосового зв’язку.

Apple обіцяє не збирати голосові дані користувачів — всі необхідні обчислення виконуватимуться локально на пристрої без залучення зовнішніх серверів компанії.

Очікування та Реальність

Демо функція, яке опублікував Маркес Браунлі, наочно демонструє, як все працює на практиці — воно дозволяє пересвідчитися, що жодних суттєвих відхилень від офіційного опису функціональності, наданого розробником, немає. Також живе демо дозволяє оцінити можливості технології синтезу мовлення за допомогою нейромереж — так, на цьому етапі розвитку ШІ має певні проблеми з відтворенням емоційної складової та тональності, тож від голосового клона віддає машинністю. Загалом же результат приголомшує та дещо лякає водночас, особливо з врахуванням 15-хвилинного запису. Різниця між ChatGPT-3.5 та ChatGPT-4 просто величезна, і якщо технології синтезу мовлення розвиватимуться так само стрімко, як мовні моделі, то невдовзі розпізнати оригінал від копії буде ой як непросто.

Англійська для IT від Englishdom.
В межах курсу можна освоїти ключові ІТ-теми та почати без проблем говорити з іноземними колегами.
Дійзнайтеся більше

Відео

Спочатку функція Personal Voice працюватиме лише з англійською мовою на пристроях із процесорами Apple. Оновлення iOS 17, яке наразі можна спробувати в беті, вийде восени разом з iPhone 15 — нова версія ОС працюватиме на iPhone XR/XS/XS Max та новіших моделях.

Disqus Comments Loading...