На ежегодной встрече представителей ассоциации компьютерной лингвистики, которая пройдет в следующем месяце в Швеции, профессор лаборатории Массачусетского университета компьютерных наук и искусственного интеллекта Бен Снайдер (Ben Snyder) и два ее сотрудника собираются представить новую систему, которая сможет самостоятельно расшифровать часть древнего угаритского языка. Разработка также поможет археологам с расшифровкой еще приблизительно 10 языков и теоретически может быть использована в Google Translate для расширения возможностей переводчика.
Чтобы добавить аналог интуиции в свою систему, разработчики заложили в нее несколько базовых правил:
- Расшифровываемый язык может быть близок к другим языкам. В случае c угаритским его родственником является иврит.
- Есть способ сопоставления букв в одном языке с их аналогами в другом. При этом частота символов в разных языках должна быть одинаковой.
- Также учитывается, что некоторые слова должны иметь общий корень в родственных языках. Например, «homme» и «hombre»
- Части слов в разных языках тоже могут иметь соответствие. Например «overloading» имеет приставку «over» и окончание «ing», таким образом система будет подразумевать, что в родственных языках слово также будет состоять из трех аналогичных частей (например, «surchargeant» в французском).
Разработанная система использует все эти предположения в различных последовательностях и проходит тысячи циклов, пока не находит наилучшую работающую модель.
Угаритский язык уже расшифрован лингвистами, поэтому возможности новой системы есть с чем сравнить. Автоматический алгоритм корректно связал 29 из 30 букв угаритского алфавита с их аналогами в иврите. Приблизительно треть слов на угаритском языке имеют свои аналоги в иврите, и компьютер смог идентифицировать 60% из них. Те, которые были определены неверно, часто отличаются всего на одну букву, поэтому проделанная компьютером работа все равно имеет определенно значение.