Новости Технологии 13.07.2023 в 10:10 comment views icon

Функция Personal Voice в iOS 17 — техноблогер Маркес Браунли показал ИИ-клонирование голоса в действии. Результат впечатляет и пугает одновременно

author avatar
https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg

Володимир Скрипін

Ексзаступник головного редактора

Раздел Технологии выходит при поддержке Favbet Tech

Одна из ключевых новых функций iOS 17 — Personal Voice, клонирование и использование копии голоса пользователя для озвучивания сообщений во время звонков iPhone. Известный ютубер и техноблогер Маркес Браунли (он же MKBHD) уже успел протестовать и поделился своими впечатлениями в коротком видео, позволяющем оценить функциональность в действии.

Как работает клонирование голоса Personal Voice в iOS 17

Personal Voice («Персональный голос») — одна из пакета новых функций доступности для людей с нарушениями зрения, слуха и когнитивных способностей, которые впервые анонсировала Apple в мае. Она синтезирует язык на основе голоса пользователя и предназначена прежде всего для тех, кто рискует потерять способность говорить вследствие болезни. Для создания копии собственного голоса нужно записать через встроенный микрофон референс — в течение 15 минут зачитывать вслух рандомизированные текстовые подсказки. Функция опирается на алгоритмы машинного обучения и интегрируется с Live Speech («Живой язык»), другой системной функцией (работает на всех устройствах Apple) для озвучивания предварительно набранного текста во время вызова Face Time или голосовой связи.

Apple обещает не собирать голосовые данные пользователей – все необходимые вычисления будут выполняться локально на устройстве без привлечения внешних серверов компании.

Ожидание и реальность

Демо функция, опубликованная Маркесом Браунли, наглядно демонстрирует, как все работает на практике — она позволяет убедиться, что никаких существенных отклонений от официального описания функциональности, предоставленного разработчиком, нет. Также живое демо позволяет оценить возможности технологии синтеза речи с помощью нейросетей — так, на этом этапе развития ИИ испытывает определенные проблемы с воспроизведением эмоциональной составляющей и тональности, поэтому от голосового клона отдает машинностью. В целом же результат впечатляет и несколько пугает одновременно, особенно с учетом 15-минутной записи. Разница между ChatGPT-3.5 и ChatGPT-4 просто огромна, и если технологии синтеза речи будут развиваться так же стремительно, как языковые модели, то вскоре распознать оригинал от копии будет ох как непросто.

Видео

Сначала функция Personal Voice будет работать только на английском языке на устройствах с процессорами Apple. Обновление iOS 17, которое можно попробовать в бете, выйдет осенью вместе с iPhone 15 — новая версия ОС будет работать на iPhone XR/XS/XS Max и более новых моделях.

Онлайн-курс "Лідогенерація у B2B" від Laba.
Де шукати нових клієнтів, щоб збільшити дохід компанії та які інструменти лідогенерації застосовувати? Розбираємо покроково та комплексно.
Дізнатись більше про курс

Функция Personal Voice в iOS 17 — техноблогер Маркес Браунли показал ИИ-клонирование голоса в действии. Результат впечатляет и пугает одновременно

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: