Microsoft показала новую технологию языкового перевода и его трансляции в речь

На мероприятии Asia 21st Century Computing, прошедшем в городе Тяньцзинь, Китай, глава исследовательского подразделения Microsoft Research Рик Рашид (Rick Rashid) провел демонстрацию технологии синхронного голосового перевода, над которой команда исследователей трудится уже несколько лет. В ее рамках, компьютер распознает голос человека, транслирует его в текст, осуществляет перевод, после чего результат вновь транслируется в речь, но уже на языке перевода. Более того, системе достаточно прослушать диктующего в течение часа, что бы сымитировать его собственный голос и начать вещать на иностранном языке.

Алгоритм системы перевода построен на моделях активности мозга. В Microsoft Research его называют Deep Neural Networks, и такая система обеспечивает намного более высокую скорость перевода и его точность, чем существующие аналоги. Лучшие альтернативы в текущий момент делают одну ошибку на каждые 4–5 слов. Исследователи Microsoft добились результата, когда ошибка возникает не чаще, чем на каждые 7–8 слов. На видео выше, начиная с 6:30, можно оценить, как системы перевода Microsoft работает в реальном времени.

Рашид понимает, что технология все еще далека от идеала, и он озвучил это, но перспективы у разработки огромны и в ближайшие несколько лет исследователи надеются «пробить языковой барьер».