Новини Технології 22.08.2023 о 19:28 comment views icon

Meta SeamlessM4T — нейромережа-перекладач-транскрибатор із підтримкою 100 мов (українська в списку). На крок ближче до Вавилонської рибки

author avatar
https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новин

Розділ Технології виходить за підтримки Favbet Tech

Meta випустила нову модель перетворення мови в текст під назвою SeamlessM4T, яка може перекладати майже 100 мов.

SeamlessM4T розшифровується як Massively Multilingual and Multimodal Machine Translation (Масивний багатомовний і мультимодальний машинний переклад), повідомляє The Verge. Модель здатна розпізнавати близько 100 мов (мову або текст) та перетворювати їх на 35 вихідних мов, у тому числі українську.

Її випустили під ліцензією Creative Commons CC BY-NC 4.0, що дає змогу використання дослідниками.

Створення універсального перекладача, подібного до вигаданої Вавилонської рибки з твору «Автостопом по галактиці» — складне завдання, оскільки існуючі системи перекладу з мови на мову та з мови на текст охоплюють лише невелику частину мов світу.

— із твердження Meta.

Згідно зі словами розробника, SeamlessM4T є значним проривом, оскільки нова модель виконує всі етапи перекладу одночасно, на відміну від інших великих систем перекладу, які розділяють переклад між різними системами.

Однією з цікавих особливостей SeamlessM4T є здатність розпізнавати, коли мовець перемикає код або коли хтось переходить між двома або більше мовами в одному реченні. Meta продемонструвала відеоприклад, де модель розпізнавала одразу гінді, телугу та англійську в одному діалозі. Цікаво, чи зможе в український суржик?

Онлайн-курс "Business English" від Laba.
Вивчіть базу граматики, лексики та вокабуляру.Використовуйте англійську в спонтанній розмові з колегами та клієнтами.Прокачайте її до впевненого В1 — для розвитку кар’єри в бізнесі.
Приєднатись до курсу

Не обійшлося й без «модерації» Meta заявила, що створила систему, яка визначає токсичні або чутливі слова при застосуванні SeamlessM4T. Вона визначатиме токсичні слова як випадки, коли «переклад може розпалювати ненависть, насильство, ненормативну лексику або образи». Начебто мета в тому, щоб визначати токсичність в перекладі, коли її немає в оригінальному тексті. SeamlessM4T також визначатиме гендерні упередження, що дає надію на правильне використання фемінітивів.

Оцініть демоверсію за посиланням. Можна надиктувати до 15 секунд і послухати переклад.

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: