Сара Езекіль та її дорослий син Ерік/AFP
Британська художниця Сара Езекіль через хворобу, пов’язану із руховими нейронами, протягом 25 років була позбавлена можливості розмовляти власним голосом.
Однак тепер жінка знову має змогу чути власний голос, завдяки штучному інтелекту та ледве чутному 8-секундному уривку зі старого домашнього відео. У віці 34 років у Сари Езекіль діагностували бічний аміотрофічний склероз. У той момент жінка була вагітна другою дитиною.
Це захворювання призводить до поступового руйнування частин нервової системи, що може викликати слабкість м’язів язика, рота та горла, через що деякі хворі фізично втрачають змогу розмовляти власним голосом. Згодом Сара Езекіль за допомогою комп’ютера оволоділа функцією генерації голоса, хоча цей голос для спілкування зовсім не був схожим на її власний.
Вона також змогла продовжити кар’єру художниці, зосередившись на створенні зображень на комп’ютері. Однак двоє її дітей після народження жодного разу не чули, як звучить справжній голос їхньої матері.
Останніми роками фахівці все частіше використовують технології для створення цифрових версій оригінального голосу людини. Однак така технологія вимагає тривалих і якісних записів. Однак навіть у такому випадку голоса звучатимуть глухо і монотонно.
За словами представника британської компанії Smartbox, яка займається комунікаціями у медичній сфері, Саймона Пула у коментарі журналістам AFP, спочатку його компанія попросила у жінки аудиозапис тривалістю близько години. Людям, які, як очікується, можуть втратити голос через такі захворювання як бічний аміотрофічний склероз, фахівці рекомендують записати власний голос для збереження власної ідентичності та відновлення змоги повноцінного спілкування.
Однак до появи смартфонів змога використовувати якісні особисті аудіозаписи була не такою поширеною і технічно складнішою. В результаті Сарі Езекіль вдалось знайти лише один, короткий і неякісний запис.
Кліп з домашнього відео 90-х років тривав лише 8 секунд, був приглушеним та супроводжувався фоновим шумом від телевізора. Це змусило Саймона Пула звернутись до технології, розробленої американськими фахівцями з ElevenLabs, що спеціалізуються у сфері штучного інтелекту. Ця технологія не тільки відтворює голос на основі найпростіших даних, а й робить його більш схожим на голос реальної людини.
Саймон Пул використав один інструмент ШІ для виділення голосового зразка з кліпу, та ще один інструмент, навчений на реальних голосах для заповнення прогалин, під час створення остаточного варіанту. Кінцевий результат виявився максимально схожим на реальний голос Сари Езекіль, включно із лондонським акцентом і легкою шепелявістю.
“Я надіслав їй зразки, і вона написала мені у відповідь, що мало не розплакалася, коли почула їх. Вона сказала, що відтворила цей запис подрузі, яка знала її ще до того, як вона втратила голос, і це було схоже на те, начебто до неї повернувся її власний голос”, — розповідає Саймон Пул.
За даними Британської асоціації з боротьби із захворюваннями рухових нейронів, вісім із десяти хворих мають проблеми з голосом після постановки діагнозу. Однак темп, висота тону і тон нинішніх голосів, що генеруються комп’ютером, можуть бути абсолютно роботизованими.
“Справжня перевага цієї нової технології штучного інтелекту полягає в тому, що голоси стали по-справжньому людяними та виразними, і вони справді повертають людяність голосу, який раніше звучав трохи комп’ютерно. Зокрема, якщо ви у зрілому віці виявите захворювання та втратите голос, дуже важливо мати можливість говорити своїм справжнім голосом, а не використовувати якийсь готовий голос”, — переконаний Саймон Пул.
Джерела: AFP; TechXplore
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.