Новости Технологии 22.08.2023 в 19:27 comment views icon

Meta SeamlessM4T — нейросеть-переводчик-транскрибатор с поддержкой 100 языков (украинский в списке). На шаг ближе к Вавилонской рыбке

author avatar
https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новостей

Раздел Технологии выходит при поддержке Favbet Tech

Meta выпустила новую модель преобразования языка в текст под названием SeamlessM4T, которая может переводить почти 100 языков.

SeamlessM4T расшифровывается как Massively Multilingual and Multimodal Machine Translation (Массивный многоязычный и мультимодальный машинный перевод), сообщает The Verge. Модель способна распознавать около 100 языков (язык или текст) и превращать их в 35 исходных языков, в том числе украинский.

Ее выпустили под лицензией Creative Commons CC BY-NC 4.0, что позволяет использование исследователями.

Создание универсального переводчика, подобного вымышленной Вавилонской рыбке из произведения «Автостопом по галактике» — сложная задача, поскольку существующие системы перевода с языка на язык и с языка на текст охватывают лишь небольшую часть языков мира.

— с утверджения Meta.

Согласно словам разработчика, SeamlessM4T является значительным прорывом, поскольку новая модель выполняет все этапы перевода одновременно, в отличие от других крупных систем перевода, которые разделяют перевод между различными системами.

Одной из интересных особенностей SeamlessM4T является способность распознавать, когда говорящий переключает код или когда кто-то переходит между двумя или более языками в одном предложении. Meta продемонстрировала видеопример, где модель распознавала сразу хинди, телугу и английский в одном диалоге. Интересно, сможет ли в украинский суржик?

Онлайн-курс "Створення особистого бренду" від Skvot.
Прокачайте особистий бренд для підсилення власного бізнесу, підвищення продажів та впізнаваність на ринку.
Дізнатись більше про програму курсу і досвід лектора

Не обошлось и без «модерации» Meta заявила, что создала систему, которая определяет токсичные или чувствительные слова при применении SeamlessM4T. Она будет определять токсичные слова как случаи, когда «перевод может разжигать ненависть, насилие, ненормативную лексику или оскорбления». Вроде бы цель в том, чтобы определять токсичность в переводе, когда ее нет в оригинальном тексте. SeamlessM4T также будет определять гендерные предубеждения, что дает надежду на правильное использование феминитивов.

Оцените демоверсию по ссылке. Можно надиктовать до 15 секунд и послушать перевод.

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: