Рубрики Блоги

Ученые Baidu представили ИИ, который способен синхронно переводить естественную речь

Опубликовал
Кирилл Иртлач

Разработчики Baidu Research представили прототип искусственного интеллекта, который умеет переводить речь в режиме реального времени.

ИИ получил название STACL («синхронный перевод с ожиданием и контролируемой задержкой»). По словам Лиан Хуанг, ведущего ученого лаборатории ИИ Baidu в Кремниевой долине, отличительная черта разработки заключается в том, что при переводе система пытается предугадывать слова – это позволяет минимизировать задержки между фразой и переводом.

Разработчики отмечают, что принцип работы STACL идентичен технике, которую используют люди.

Курс Power Skills For Tech від Enlgish4IT.
Зменшіть кількість непорозумінь на робочому місці та станьте більш ефективним у спілкуванні в мультикультурній команді. Отримайте знижку 10% за промокодом ITCENG.
Реєстрація на курс

«Переводить речь в реальном времени – работа не из легких. Переводчикам нужно одновременно слушать, мысленно переводить и говорить на другом языке, отставая не более чем на несколько слов. Именно вследствие высокой умственной нагрузки синхронисты, как правило, работают в командах, заменяя друг друга через каждые 10-30 минут», – заметил Хуанг.

И хотя кажется, что с задачами, требующими параллельной обработки, компьютеры должны справляться как нельзя лучше, все существующие на сегодняшний день искусственные «толмачи» переводят последовательно, то есть ожидают окончания предложения и только затем выдают перевод. Несмотря на то, что их работа достаточно точна, ее скорости недостаточно, чтобы переводить речь в режиме реального времени.

STACL, по словам разработчика, предугадывает слова весьма качественно, но не без ошибок. Чтобы повысить точность работы искусственного интеллекта, разработчики рекомендуют его предварительно натренировать на требуемой тематике.

«Как и в случае человека, машине нужно предварительно изучить тему перевода – например, «почитать» медицинскую литературу перед конференцией на тему медицины», — говорит Хуанг.

Для удобства, задержки перевода для отставания от исходной фразы можно регулировать. По умолчанию они составляют 3–5 слов.

Сейчас STACL может синхронно переводить речь в текст. В дальнейшем разработчики намерены научить его озвучивать перевод.

В Baidu отмечают, что STACL предназначен исключительно для частного использования и не призван заменить живых переводчиков, которые работают, например, на встречах в ООН, где требуется предельно ясный перевод.

Источники: Spectrum, tproger

Disqus Comments Loading...