Новини Технології 13.07.2023 о 10:10 comment views icon

Функція Personal Voice в iOS 17 — техноблогер Маркес Браунлі показав ШІ-клонування голосу в дії. Результат приголомшує і лякає водночас

author avatar
https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg

Володимир Скрипін

Ексзаступник головного редактора

Розділ Технології виходить за підтримки Favbet Tech

Одна з ключових нових функцій iOS 17 — Personal Voice, клонування та використання «копії» голосу користувача для озвучення повідомлень під час дзвінків iPhone. Відомий ютубер та техноблогер Маркес Браунлі (він же MKBHD) вже встиг її протестувати та поділився своїми враженнями в короткому відео, яке дозволяє оцінити функціональність в дії.

Як працює клонування голосу Personal Voice в iOS 17

Personal Voice («Персональний голос») — одна із пакета нових функцій доступності для людей з порушеннями зору, слуху та когнітивних здібностей, які Apple вперше анонсувала у травні. Вона синтезує мову на основі голосу користувача та призначена насамперед для тих, хто ризикує втратити здатність розмовляти через хворобу. Для створення «копії» власного голосу потрібно записати через вбудований мікрофон референс — протягом 15 хвилин зачитувати вголос рандомізовані текстові підказки. Функція спирається на алгоритми машинного навчання та інтегрується з Live Speech («Жива мова»), іншою системною функцією (працюватиме на всіх пристроях Apple) для озвучування попередньо набраного тексту під час дзвінка Face Time чи голосового зв’язку.

Apple обіцяє не збирати голосові дані користувачів — всі необхідні обчислення виконуватимуться локально на пристрої без залучення зовнішніх серверів компанії.

Очікування та Реальність

Демо функція, яке опублікував Маркес Браунлі, наочно демонструє, як все працює на практиці — воно дозволяє пересвідчитися, що жодних суттєвих відхилень від офіційного опису функціональності, наданого розробником, немає. Також живе демо дозволяє оцінити можливості технології синтезу мовлення за допомогою нейромереж — так, на цьому етапі розвитку ШІ має певні проблеми з відтворенням емоційної складової та тональності, тож від голосового клона віддає машинністю. Загалом же результат приголомшує та дещо лякає водночас, особливо з врахуванням 15-хвилинного запису. Різниця між ChatGPT-3.5 та ChatGPT-4 просто величезна, і якщо технології синтезу мовлення розвиватимуться так само стрімко, як мовні моделі, то невдовзі розпізнати оригінал від копії буде ой як непросто.

Відео

Спочатку функція Personal Voice працюватиме лише з англійською мовою на пристроях із процесорами Apple. Оновлення iOS 17, яке наразі можна спробувати в беті, вийде восени разом з iPhone 15 — нова версія ОС працюватиме на iPhone XR/XS/XS Max та новіших моделях.

Онлайн-курс "Project Manager" від Laba.
Станьте проджектом, що вміє передбачати ризики наперед і доводити проєкт до результату, який хочуть замовники. Поділиться досвідом Павло Харіков, former Head of PMO в Kyivstar.
Програма курсу і реєстрація

Функція Personal Voice в iOS 17 — техноблогер Маркес Браунлі показав ШІ-клонування голосу в дії. Результат приголомшує і лякає водночас

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: