На мероприятии Asia 21st Century Computing, прошедшем в городе Тяньцзинь, Китай, глава исследовательского подразделения Microsoft Research Рик Рашид (Rick Rashid) провел демонстрацию технологии синхронного голосового перевода, над которой команда исследователей трудится уже несколько лет. В ее рамках, компьютер распознает голос человека, транслирует его в текст, осуществляет перевод, после чего результат вновь транслируется в речь, но уже на языке перевода. Более того, системе достаточно прослушать диктующего в течение часа, что бы сымитировать его собственный голос и начать вещать на иностранном языке.
Алгоритм системы перевода построен на моделях активности мозга. В Microsoft Research его называют Deep Neural Networks, и такая система обеспечивает намного более высокую скорость перевода и его точность, чем существующие аналоги. Лучшие альтернативы в текущий момент делают одну ошибку на каждые 4–5 слов. Исследователи Microsoft добились результата, когда ошибка возникает не чаще, чем на каждые 7–8 слов. На видео выше, начиная с 6:30, можно оценить, как системы перевода Microsoft работает в реальном времени.
Рашид понимает, что технология все еще далека от идеала, и он озвучил это, но перспективы у разработки огромны и в ближайшие несколько лет исследователи надеются «пробить языковой барьер».
Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: