AIが歴史家たちの助けとなり、数千年にわたり損傷した古代ギリシャの碑文を補完

AIが歴史家たちの助けとなり、数千年にわたり損傷した古代ギリシャの碑文を補完

古代ギリシャの学者であること自体が根本的に困難であるかのように、彼らが頼りにする一次文献は数千年も前のものなので、修復不可能なほど損傷していることがしばしばあります。歴史家たちは、DeepMindが開発した機械学習モデル「Ithaca」という強力な新ツールを手にするかもしれません。このモデルは、欠落した単語や文献の場所、年代を驚くほど正確に推測します。これはAIの珍しい応用例ですが、テクノロジーの世界以外でもAIがいかに有用であるかを示す例です。

不完全な古代文書の問題は、専門家が劣化した資料を扱う多くの分野に及んでいます。原典は石、粘土、パピルスで作られ、アッカド語、古代ギリシャ語、線文字Aで書かれ、食料品店の請求書から英雄の旅まで、様々な内容が記されています。しかし、それら全てに共通するのは、数千年の間に蓄積された損傷です。

文章が擦り切れたり、破れたりした空白部分は、しばしば「空白」と呼ばれます。空白は、文字が1つ抜けている程度の短いものから、1章、あるいは物語全体に及ぶ長いものまであります。空白を埋めるのは簡単だったり、不可能だったりすることもあります。しかし、どこかから始めなければなりません。そして、Ithaca はまさにそのお手伝いをします。

古代ギリシャの膨大な文献ライブラリを基盤とするイタカ(オデュッセウスの故郷の島にちなんで名付けられた)は、欠落している単語やフレーズが何であるかを推測できるだけでなく、その年代や執筆場所も推測できる。ただし、単独で叙事詩サイクル全体を埋めるわけではない。これは、これらの文献を扱う人々のためのツールであり、解決策ではない。

Nature誌に掲載された論文は、ペリクレス朝アテネの法令を例に挙げ、その有効性を実証しています。紀元前445年頃に書かれたと考えられていた法令ですが、イタカはテキスト分析に基づき、実際には紀元前420年頃のものであると示唆しました。これは、より最近の証拠とも一致しています。大したことではないように思えるかもしれませんが、権利章典が実際にはその20年後に書かれたとしたらどうなるでしょうか。

イサカからの出力の図解: 単語、場所、日付。
画像クレジット: DeepMind

テキスト自体に関しては、研究に参加した専門家たちは最初のパスで約25%の正解率を記録しました。これは決して素晴らしい数字とは言えませんが、もちろんテキストの復元は午後のちょっとしたお遊びではなく、長期的なプロジェクトです。しかし、Ithacaと組み合わせることで、彼らはすぐに72%の正解率を達成しました。これは、人間の方が最終的にはより正確であるものの、行き詰まりを素早く解消したり、開始点を提案したりすることでプロセスをスピードアップできる、他の状況でもよく見られる現象です。医療データでは、AIがすぐにフラグを立てる異常を見落としがちですが、最終的には細部を認識し、正しい答えを見つけるのは人間の専門知識なのです。

古代ギリシャ語の欠落部分が多いテキストをお持ちの場合は、Ithaca の簡易版をこちらで試すことができます。また、提供されている例文を使って、要求された欠落部分をどのように埋めるかを確認することもできます。より長い文章や10文字以上欠落している文章の場合は、こちらの Colab ノートブックで試してみてください。コードはこちらの GitHub ページから入手できます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

イサカにとって古代ギリシャ語は明らかに有望な分野ですが、チームは既に他の言語にも力を入れています。アッカド語、デモティック語、ヘブライ語、マヤ語などがリストに載っており、今後さらに多くの言語が追加されることを期待しています。

「イサカは、人文科学における自然言語処理と機械学習の潜在的な貢献を示しています」と、このプロジェクトに携わったアテネ大学のイオン・アンドロウツポウロス教授は述べています。「この可能性をさらに示すには、イサカのようなプロジェクトがさらに必要です。同時に、人文科学とAI手法の両方をより深く理解できる未来の研究者を育成するための、適切なコースや教材も必要です。」

デヴィン・コールドウェイはシアトルを拠点とする作家兼写真家です。

彼の個人ウェブサイトは coldewey.cc です。

バイオを見る