Google внедрила поддержку распознавания речи для 21 нового языка, доведя их общее количество до 119

Google внедрила поддержку распознавания речи для 21 нового языка, доведя их общее количество до 119

Google вкладывает значительные средства в разработку самообучаемых нейросетей, используемых для автоматического распознавания речи, и сейчас компания объявила о добавлении поддержки 21 новых языков, включая армянский, бенгальский, лаосский, сингальский, суданский, непальский, урду и тамильский. С этим обновлением Google довела общее количество языков, для которых доступна функция перевода речи в текст, до 119 и теперь еще больше пользователей могут воспользоваться ее преимуществами. Google утверждает, что голосом текст можно вводить втрое быстрее по сравнению с обычным набором при помощи клавиатуры.

Для расширения списка поддерживаемых языков компания Google обратилась к носителям языков из местного населения. Последние помогли поисковому гиганту собрать образцы разговорной речи (общие фразы) для дальнейшего обучения нейросетей. Обучаясь на примерах, машинам удалось повысить точность распознавания речи на том или ином языку.

Новые языки уже добавлены в Cloud Speech API и вскоре станут доступными в различных приложениях и сервисах Google с поддержкой голосового ввода, включая Google Translate и Gboard. Само собой, распознавание речи не будет работать, если функция голосового ввода отключена.

Одновременно с новыми языками Google добавила еще одну возможность, которая может пригодиться родителям и позволит диктовать даже смайлики эмодзи. Поначалу диктовать эмодзи можно будет только на английском, но со временем функция станет доступна и на других языках.

Вот полный список всех добавленных языков: амхарский (Эфиопия), армянский (Армения), азербайджанский (Азербайджан), бенгальский (Бангладеш, Индия), английский (Гана, Кения, Нигерия, Танзания), грузинский (Грузия), гуджаратский (Индия), яванский (Индонезия), каннада (Индия), кхмерский (Камбоджа), лаосский (Лаос), латышский (Латвия), малаялам (Индия), марафи (Индия), непальский (Непал), сингальский (Шри-Ланка), суданский (Индонезия), суахили (Танзания, Кения), тамильский (Индия, Сингапур, Шри-Ланка, Малайзия), телугу (Индия) и урду (Пакистан, Индия).

Источник: Google