Новини Технології 13.07.2023 о 10:10

Функція Personal Voice в iOS 17 — техноблогер Маркес Браунлі показав ШІ-клонування голосу в дії. Результат приголомшує і лякає водночас

https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg

Володимир Скрипін

Заступник головного редактора, керівник відділу новин

Одна з ключових нових функцій iOS 17 — Personal Voice, клонування та використання «копії» голосу користувача для озвучення повідомлень під час дзвінків iPhone. Відомий ютубер та техноблогер Маркес Браунлі (він же MKBHD) вже встиг її протестувати та поділився своїми враженнями в короткому відео, яке дозволяє оцінити функціональність в дії.

Як працює клонування голосу Personal Voice в iOS 17

Personal Voice («Персональний голос») — одна із пакета нових функцій доступності для людей з порушеннями зору, слуху та когнітивних здібностей, які Apple вперше анонсувала у травні. Вона синтезує мову на основі голосу користувача та призначена насамперед для тих, хто ризикує втратити здатність розмовляти через хворобу. Для створення «копії» власного голосу потрібно записати через вбудований мікрофон референс — протягом 15 хвилин зачитувати вголос рандомізовані текстові підказки. Функція спирається на алгоритми машинного навчання та інтегрується з Live Speech («Жива мова»), іншою системною функцією (працюватиме на всіх пристроях Apple) для озвучування попередньо набраного тексту під час дзвінка Face Time чи голосового зв’язку.

Apple обіцяє не збирати голосові дані користувачів — всі необхідні обчислення виконуватимуться локально на пристрої без залучення зовнішніх серверів компанії.

Очікування та Реальність

Демо функція, яке опублікував Маркес Браунлі, наочно демонструє, як все працює на практиці — воно дозволяє пересвідчитися, що жодних суттєвих відхилень від офіційного опису функціональності, наданого розробником, немає. Також живе демо дозволяє оцінити можливості технології синтезу мовлення за допомогою нейромереж — так, на цьому етапі розвитку ШІ має певні проблеми з відтворенням емоційної складової та тональності, тож від голосового клона віддає машинністю. Загалом же результат приголомшує та дещо лякає водночас, особливо з врахуванням 15-хвилинного запису. Різниця між ChatGPT-3.5 та ChatGPT-4 просто величезна, і якщо технології синтезу мовлення розвиватимуться так само стрімко, як мовні моделі, то невдовзі розпізнати оригінал від копії буде ой як непросто.

Відео

Спочатку функція Personal Voice працюватиме лише з англійською мовою на пристроях із процесорами Apple. Оновлення iOS 17, яке наразі можна спробувати в беті, вийде восени разом з iPhone 15 — нова версія ОС працюватиме на iPhone XR/XS/XS Max та новіших моделях.

Функція Personal Voice в iOS 17 — техноблогер Маркес Браунлі показав ШІ-клонування голосу в дії. Результат приголомшує і лякає водночас

Завантаження коментарів...

Нові тексти

Дописи
І знову Маск: друге камео у Cyberpunk 2077
https://itc.ua/wp-content/uploads/2023/05/asyris-96x96.png *** https://itc.ua/wp-content/uploads/2023/05/asyris-96x96.png *** https://itc.ua/wp-content/uploads/2023/05/asyris-96x96.png

Asyris

Головний Модератор Блогів

Дописи
Мій ТОП ігр на ПК про «живих мерців» і «коротко» про жанр
https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg *** https://itc.ua/wp-content/uploads/2023/09/ledifen-gordonfreeman-finale-150x150.jpg
Дописи
Огляд ноутбука HP EliteBook 650 G10 Silver
https://secure.gravatar.com/avatar/c1c098e5869ac854eea333caef345c56?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/c1c098e5869ac854eea333caef345c56?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.png

Straume23

автор

Загрузити ще

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: