Новости Новости 09.05.2019 в 09:17 comment

Использование машинного перевода Google Translate только вредит «Википедии»

author avatar
https://secure.gravatar.com/avatar/f70c20cac52f4fead6c2d81412958614?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/f70c20cac52f4fead6c2d81412958614?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

«Википедия» была создана с целью сделать знания доступными каждому, однако большая часть материала публикуется на английском языке. На текущий момент англоязычная «Википедия» является крупнейшим изданием с 5,5 млн статей. Только 15 из 301 издания могут похвастаться тем, что количество их статей превысило отметку 1 млн. Но зачастую их качество оставляет желать лучшего, не говоря уже о том, что некоторые важные материалы попросту отсутствуют. В самой «Википедии» эту проблему связывают с машинным переводом.

В январе этого года некоммерческая организация Wikimedia Foundation заключила соглашение с компанией Google, согласно которому последняя разрешила редакторам «Википедии» использовать переводчик Google Translate наряду с собственным инструментом перевода контента на основе программного обеспечение с открытым исходным кодом. Но для редакторов, работающих с неанглоязычными изданиями, это оказалось ещё большей проблемой, что возобновило дискуссию о том, а нужно ли «Википедии» вообще использовать машинный перевод.

При правильном использовании автоматический перевод может сэкономить драгоценное время редакторам, создающим недоукомплектованные издания. В противном случае результаты могут быть катастрофическими. Например, редактор португальской «Википедии» указал на недопустимый машинный перевод с английского языка на португальский в одной из статей, в которой оригинальное выражение «village pump» (сельский колодец/насосная станция) превратилось в «bomb the village» (бомбить деревню).

Автоматические переводы стали такой проблемой, что в некоторых редакциях «Википедии» создали специальные правила, которые позволяют редакторам исключать подобные статьи или удалять, если для них не существует других версий перевода. Для упрощённого удаления этих статей даже есть специальный критерий «X2. Страницы, созданные с помощью инструмента перевода».

Использование машинного перевода Google Translate только вредит «Википедии»

Профессор Дуглас Хофштадтер (Douglas Hofstadter) из Индианского университета в Блумингтоне считает неверным мнение о том, что ИИ достиг паритета с человеком в возможностях перевода. В своей статье по этой теме он утверждает, что машинный перевод является поверхностным, ИИ обычно пропускает более глубокое значение слов и предложений. Такие системы учатся переводить, изучая статистические закономерности в больших массивах данных, а это означает, что они слепы к нюансам языка и испытывают недостаток в здравом смысле.

Курс "Web design" від Web-academy.
Швидкий початок кар'єри у сфері IT! Опануйте професію веб-дизайнера — почніть самостійно керувати своїм часом й отримувати високий дохід вже за 9 тижнів.
Дізнатися більше

Проблема «Википедии» в том, что их машинный перевод требует пристального контроля со стороны редакторов. Они должны хорошо понимать оба языка, на которые осуществляется перевод, однако в реальности (особенно для маленьких изданий) это не всегда так, поскольку статьями по большому счёту занимаются обычные пользователи-добровольцы. Зачастую эти пользователи используют автоматический перевод и публикуют статьи без каких-либо рецензий. В результате мы имеем некачественный перевод статьи или откровенную чушь. В конечном счёте это может привести к потере авторитета «Википедии» как надёжного источника информации.

Критиков машинного перевода немало. Сообщество индонезийской «Википедии» даже официально потребовало от Wikimedia Foundation удалить инструмент машинного перевода из издания. Большинство пользователей склоняются к тому, что машина никогда не заменит человека в переводе, просто потому, что не может понимать сложные фразы, которые не переводятся дословно.

Источник: The Verge

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: