Компьютер смог расшифровать древний язык

На ежегодной встрече представителей ассоциации компьютерной лингвистики, которая пройдет в следующем месяце в Швеции, профессор лаборатории Массачусетского университета компьютерных наук и искусственного интеллекта Бен Снайдер (Ben Snyder) и два ее сотрудника собираются представить новую систему, которая сможет самостоятельно расшифровать часть древнего угаритского языка. Разработка также поможет археологам с расшифровкой еще приблизительно 10 языков и теоретически может быть использована в Google Translate для расширения возможностей переводчика.

Чтобы добавить аналог интуиции в свою систему, разработчики заложили в нее несколько базовых правил:

  • Расшифровываемый язык может быть близок к другим языкам. В случае c угаритским его родственником является иврит.
  • Есть способ сопоставления букв в одном языке с их аналогами в другом. При этом частота символов в разных языках должна быть одинаковой.
  • Также учитывается, что некоторые слова должны иметь общий корень в родственных языках. Например, «homme» и «hombre»
  • Части слов в разных языках тоже могут иметь соответствие. Например «overloading» имеет приставку «over» и окончание «ing», таким образом система будет подразумевать, что в родственных языках слово также будет состоять из трех аналогичных частей (например, «surchargeant» в французском).

Разработанная система использует все эти предположения в различных последовательностях и проходит тысячи циклов, пока не находит наилучшую работающую модель.

Угаритский язык уже расшифрован лингвистами, поэтому возможности новой системы есть с чем сравнить. Автоматический алгоритм корректно связал 29 из 30 букв угаритского алфавита с их аналогами в иврите. Приблизительно треть слов на угаритском языке имеют свои аналоги в иврите, и компьютер смог идентифицировать 60% из них. Те, которые были определены неверно, часто отличаются всего на одну букву, поэтому проделанная компьютером работа все равно имеет определенно значение.