Женщина заговорила голосом, который потеряла 25 лет назад: помог ИИ и 8 секунд домашнего видео

Опубликовал Олександр Федоткін

Британская художница Сара Эзекиль из-за болезни, связанной с двигательными нейронами, в течение 25 лет была лишена возможности разговаривать собственным голосом.

Однако теперь женщина снова имеет возможность слышать собственный голос, благодаря искусственному интеллекту и едва слышному 8-секундному отрывку из старого домашнего видео. В возрасте 34 лет у Сары Эзекиль диагностировали боковой амиотрофический склероз. В тот момент женщина была беременна вторым ребенком

Это заболевание приводит к постепенному разрушению частей нервной системы, что может вызвать слабость мышц языка, рта и горла, из-за чего некоторые больные физически теряют возможность разговаривать собственным голосом. Впоследствии Сара Эзекиль с помощью компьютера овладела функцией генерации голоса, хотя этот голос для общения совсем не был похож на ее собственный. 

Она также смогла продолжить карьеру художницы, сосредоточившись на создании изображений на компьютере. Однако двое ее детей после рождения ни разу не слышали, как звучит настоящий голос их матери.

В последние годы специалисты все чаще используют технологии для создания цифровых версий оригинального голоса человека. Однако такая технология требует длительных и качественных записей. И даже в таком случае голоса будут звучать глухо и монотонно. 

По словам представителя британской компании Smartbox, которая занимается коммуникациями в медицинской сфере, Саймона Пула в комментарии журналистам AFP, сначала его компания попросила у женщины аудиозапись продолжительностью около часа. Людям, которые, как ожидается, могут потерять голос из-за таких заболеваний как боковой амиотрофический склероз, специалисты рекомендуют записать собственный голос для сохранения собственной идентичности и восстановления возможности полноценного общения. 

Однако до появления смартфонов возможность использовать качественные личные аудиозаписи была не такой распространенной и технически более сложной. В результате Саре Эзекиль удалось найти только одну, короткую и некачественную запись. 

Клип из домашнего видео 90-х годов длился всего 8 секунд, был приглушенным и сопровождался фоновым шумом от телевизора. Это заставило Саймона Пула обратиться к технологии, разработанной американскими специалистами из ElevenLabs, специализирующихся в сфере искусственного интеллекта. Эта технология не только воспроизводит голос на основе простейших данных, но и делает его более похожим на голос реального человека.

Саймон Пул использовал один инструмент ИИ для выделения голосового образца из клипа, и еще один инструмент, обученный на реальных голосах, для заполнения пробелов, при создании окончательного варианта. Конечный результат оказался максимально похожим на реальный голос Сары Эзекиль, включая лондонский акцент и легкую шепелявость. 

«Я прислал ей образцы, и она написала мне в ответ, что чуть не расплакалась, когда услышала их. Она сказала, что воспроизвела эту запись подруге, которая знала ее еще до того, как она потеряла голос, и это было похоже на то, как будто к ней вернулся ее собственный голос», — рассказывает Саймон Пул. 

По данным Британской ассоциации по борьбе с заболеваниями двигательных нейронов, восемь из десяти больных имеют проблемы с голосом после постановки диагноза. Однако темп, высота тона и тон нынешних голосов, генерируемых компьютером, могут быть абсолютно роботизированными. 

«Настоящее преимущество этой новой технологии искусственного интеллекта заключается в том, что голоса стали по-настоящему человечными и выразительными, и они действительно возвращают человечность голоса, который раньше звучал немного компьютерно. В частности, если вы в зрелом возрасте обнаружите заболевание и потеряете голос, очень важно иметь возможность говорить своим настоящим голосом, а не использовать какой-то готовый голос», — убежден Саймон Пул. 

Источники: AFP; TechXplore

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.