Искусственный интеллект Aeneas: революция в расшифровке древнеримских надписей

В Римской империи письменность пронизывала все сферы жизни, от грандиозных общественных сооружений до самых обыденных предметов обихода. На камне, металле и керамике высекали политические лозунги, любовные послания, эпитафии, торговые контракты, приглашения на пиры и даже магические заклинания. Эти тексты служат бесценным окном в повседневность античного мира для современных историков. Однако многие из них дошли до нас повреждёнными: стёртыми, разбитыми или намеренно уничтоженными, что делает их реконструкцию, датировку и атрибуцию крайне сложной задачей.

Прорывное решение этой проблемы представлено международной группой учёных в журнале Nature. Они создали искусственный интеллект Aeneas — первую в мире модель, способную анализировать и интерпретировать древние латинские надписи. Этот инструмент, разработанный совместно с Ноттингемским, Уорикским, Оксфордским университетами и Афинским университетом экономики и бизнеса (AUEB), кардинально меняет подход к эпиграфике, науке о надписях.

От рутины к революции: как работает ИИ

До недавнего времени историки вручную искали «текстовые параллели» — схожие по формулировкам, структуре или месту нахождения надписи. Такой кропотливый анализ мог занимать недели и даже месяцы. Aeneas выполняет эту работу за считанные секунды, обрабатывая тысячи записей из различных баз данных и находя скрытые связи между фрагментами, что позволяет учёным точнее восстанавливать их смысл.

Система, названная в честь мифического героя Энея, основана на более ранней разработке для работы с древнегреческими текстами — модели Ithaca. Однако Aeneas обладает расширенным функционалом: она не только восстанавливает утраченные части текста, но и помещает надпись в исторический контекст, помогая исследователям делать более глубокие выводы о прошлом.

Уникальные возможности новой модели

Aeneas создаёт для каждой надписи своего рода «исторический отпечаток», выявляя глубинные связи между документами. В отличие от предшественников, эта модель анализирует не только сам текст, но и изображение артефакта, что помогает точнее определить его происхождение.

Обратите внимание: Почему повсюду у древних римлян красовалась аббревиатура «S.P.Q.R.» и что она означала.

Кроме того, впервые появилась возможность восстанавливать недостающие символы, даже когда их точное количество неизвестно, что критически важно при работе с сильно повреждёнными объектами.

Aeneas представляет собой многомодальную нейронную сеть, обученную на объединённых данных из крупнейших эпиграфических баз: Базы данных римских надписей (EDR), Гейдельбергской базы данных (EDH) и базы данных Клауса Слаби (EDCS-ELT). Этот массив информации был систематизирован в специальный набор данных латинских надписей (LED).

Точность и практические результаты

В ходе испытаний модель показала впечатляющие результаты: точность восстановления пробелов длиной до 10 символов составила 73%, а даже когда длина утраченного фрагмента была неизвестна — 58%. При определении географического происхождения Aeneas верно указал одну из 62 римских провинций в 72% случаев, а при датировке средняя погрешность составила всего 13 лет по сравнению с экспертными оценками.

Ярким примером эффективности системы стал анализ знаменитой автобиографии императора Августа «Деяния божественного Августа», датировка которой долгое время вызывала споры. Aeneas не только выделил два наиболее вероятных периода её создания (около 10–1 гг. до н.э. и 10–20 гг. н.э.), но и связал текст с другими документами эпохи, наглядно показав, как имперская идеология отражалась в разных источниках.

Доступность для науки и образования

Чтобы оценить практическую пользу системы, 23 историка-эпиграфиста протестировали Aeneas в работе. Результаты показали, что сочетание экспертных знаний с подсказками искусственного интеллекта значительно повышает точность интерпретации. Один из участников эксперимента отметил: «Сходства, обнаруженные Aeneas, полностью изменили моё понимание надписи. Модель выявила ключевые детали для её реставрации и датировки».

Для широкого доступа разработчики опубликовали бесплатную интерактивную версию системы на сайте predictingthepast.com, где ей могут пользоваться исследователи, студенты и музейные работники. Код модели и данные находятся в открытом доступе, что позволяет адаптировать её для работы с другими древними языками и носителями, такими как папирусы или монеты.

Параллельно команда обновила систему для греческих надписей Ithaca, интегрировав в неё возможности Aeneas, и разработала учебные курсы по использованию этих инструментов в рамках инициативы ЕС и ЮНЕСКО по развитию цифровых компетенций в гуманитарных науках.

Этот прорыв на стыке искусственного интеллекта и исторической науки открывает новую главу в изучении античности, позволяя учёным быстрее и точнее расшифровывать послания, оставленные нам древними цивилизациями, и глубже понимать их мир.

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: В Римской империи письменность была повсюду: от монументальных сооружений до бытовых предметов.