Блоги
Ученые Baidu представили ИИ, который способен синхронно переводить естественную речь

Ученые Baidu представили ИИ, который способен синхронно переводить естественную речь

Ученые Baidu представили ИИ, который способен синхронно переводить естественную речь


Разработчики Baidu Research представили прототип искусственного интеллекта, который умеет переводить речь в режиме реального времени.

ИИ получил название STACL («синхронный перевод с ожиданием и контролируемой задержкой»). По словам Лиан Хуанг, ведущего ученого лаборатории ИИ Baidu в Кремниевой долине, отличительная черта разработки заключается в том, что при переводе система пытается предугадывать слова – это позволяет минимизировать задержки между фразой и переводом.

Разработчики отмечают, что принцип работы STACL идентичен технике, которую используют люди.

«Переводить речь в реальном времени – работа не из легких. Переводчикам нужно одновременно слушать, мысленно переводить и говорить на другом языке, отставая не более чем на несколько слов. Именно вследствие высокой умственной нагрузки синхронисты, как правило, работают в командах, заменяя друг друга через каждые 10-30 минут», – заметил Хуанг.

И хотя кажется, что с задачами, требующими параллельной обработки, компьютеры должны справляться как нельзя лучше, все существующие на сегодняшний день искусственные «толмачи» переводят последовательно, то есть ожидают окончания предложения и только затем выдают перевод. Несмотря на то, что их работа достаточно точна, ее скорости недостаточно, чтобы переводить речь в режиме реального времени.

STACL, по словам разработчика, предугадывает слова весьма качественно, но не без ошибок. Чтобы повысить точность работы искусственного интеллекта, разработчики рекомендуют его предварительно натренировать на требуемой тематике.

«Как и в случае человека, машине нужно предварительно изучить тему перевода – например, «почитать» медицинскую литературу перед конференцией на тему медицины», — говорит Хуанг.

Для удобства, задержки перевода для отставания от исходной фразы можно регулировать. По умолчанию они составляют 3–5 слов.

Сейчас STACL может синхронно переводить речь в текст. В дальнейшем разработчики намерены научить его озвучивать перевод.

В Baidu отмечают, что STACL предназначен исключительно для частного использования и не призван заменить живых переводчиков, которые работают, например, на встречах в ООН, где требуется предельно ясный перевод.

Источники: Spectrum, tproger


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: