Що написано в Геркуланумських сувоях? Штучний інтелект розшифрував перший повноцінний текст

Опубликовал
Катерина Даньшина

Майже 2000 років тому виверження Везувію «‎підсмажило» давньоримський Геркуланум, поховавши величезну бібліотеку під 20-метровим шаром попелу — деякі сувої зрештою відкопали, однак більшість залишалась нечитабельними до сьогодні, доки «не прийшов» штучний інтелект.

Значна частина фрагментів радше нагадували шматочки вугілля, аніж папір, і, як вважається, колись належала людині, на ім’я Пізон.

Лабораторія Брента Сілза в Університеті Кентуккі багато років випробовує метод «‎віртуального розгортання» для розшифровки давніх текстів. Команда поєднує цифрове сканування з мікрокомп’ютерною томографією — неінвазивним методом, який часто використовують для візуалізації раку — із сегментацією для цифрового створення сторінок, доповнених методами текстурування та зведення. Сілз для цього розробив власне програмне забезпечення Volume Cartography, яке у 2016-му вже допомогло команді «переглянути» сувій Ен-Геді, знайдений на західному березі Мертвого моря, з кількома першими віршами з книги Левіт.

Утім робота над сувоями з Геркулануму ускладнювалась тим, що чорнила виготовлені на основі вугілля та води (чорнило на сувої Ен-Геді містить метал, тому яскраво світиться на комп’ютерній томографії), хоча зрештою Сілз зрозумів, що КТ все-таки може знайти крихітні відмінності в текстурі, які вкажуть на ділянки папірусу з текстом, та навчив штучну нейронну мережу робити саме це.

У 2019 році дослідник перевіз два неушкоджених сувої до синхротронної рентгенівської установки поблизу Оксфорда та зробив скани з найвищою роздільною здатністю, які згодом використали для конкурсу Vesuvius Challenge, запущеного у березні торік. Близько 1500 команд отримали шанс заробити кілька сот тисяч доларів у випадку успішного розшифрування тексту.

Курс QA Manual (Тестування ПЗ мануальне) від Powercode academy.
Навчіться знаходити помилки та контролювати якість сайтів та додатків.
Записатися на курс
Початкова чернетка транскрипції тексту сувою.

Минулої осені за допомогою машинного навчання в одному зі стародавніх сувоїв вдалося розпізнати деякі літери й навіть слова — а нині об’єднана команда з трьох учасників розшифрувала 15 колонок тексту:

«Автор [ймовірно, Філодем] пише про музику, їжу та те, як насолоджуватися радощами життя», — пишуть організатори. «У заключному розділі він кидає тінь на неназваних ідеологічних супротивників — можливо, стоїків? — яким «нема чого сказати про задоволення, ані загалом, ані окремо».

Команду у складі Люка Фарітора, Юсефа Найдера та Джулліана Шиллінгера нагородили грошовим призом у розмірі $700 тис.

Однак 15 колонок — це всього 5% від загального змісту сувою. Для наступного Vesuvius Challenge, який вже оголосили, пропонують $100 000 за розшифровку 90% з чотирьох сувоїв, відсканованих на цю мить. Одне з завдань цього челленджу — удосконалення автоматичної сегментації текстів, оскільки ручне виконання потребує багато часу і грошей (понад $100 за квадратний сантиметр).

Джерело: Ars Technica

Disqus Comments Loading...