618ZXW

甲骨文物の高精度データが中国に返還され、AI が古代のテキストの解釈を支援し、甲骨文の新しい画像の発見につながりました。

「来年はフランスへ行き、甲骨文字を持ち帰ります」。2024年12月下旬、安養師範大学にある教育部甲骨文字情報処理重点実験室の研究者らがフランスを訪れ、フランス国立図書館を含む甲骨文字収集機関4機関と協力協定を締結し、長らく故郷を離れていた甲骨文字文化遺産をデジタル形式で「持ち帰る」ことを目指した。

2024年8月5日、 「世界甲骨デジタル返還プロジェクト」が正式に発足した。劉永歌研究所長は張展、李邦、郭安、龔慕凡の各チームメンバーを率いて韓国へ渡り、8月13日に甲骨文物7点の高精度データを持ち帰った。これは、海外で失われた中国の甲骨文化遺産がデジタル形式で祖国に返還された初めてのケースである

2024年6月、劉永歌所長は華中科技大学、アデレード大学、華南理工大学の研究者と共同で、画像ベースの生成モデルを用いて、甲骨文字解読に最適化された条件付き拡散モデル「甲骨文字解読(OBSD)」を学習しました。この研究成果はACL 2024に選出されただけでなく、最優秀論文賞も受賞しました。

  • 詳細レポートを見るにはクリックしてください: ACL 2024 に選出されました! 華中科技大学がゼロショット学習を導入し、甲骨文字解読に最適化された条件付き拡散モデルをリリースしました。

当研究室は既に、甲骨文書データベース、目録データベース、文字データベースを統合した「銀麒文源」甲骨ビッグデータプラットフォームを構築し、世界に公開しています。これは、世界で最も完全で標準化され、権威があり、既存のデータが最も豊富な甲骨データプラットフォームです。このプラットフォームの開設は、甲骨研究がインテリジェント時代へと突入したことを象徴しています。

実際、近年、AIは古代中国文学の研究分野でより深く応用され、研究者の作業効率を加速させ、歴史の謎を解明する「達人」にさえなりつつある。

古代中国のテキスト解釈:一言は千枚の金貨の価値がある。

2016年、国立漢文博物館は、専門家委員会の審査を通過した未解読の甲骨文字1点につき10万元の奨励金を支給する旨の通知を出しました。まさに「一字一字、金千枚」の事例と言えるでしょう。しかし、この多額の奨励金にもかかわらず、約4,000点ある甲骨文字のうち、解読に成功したのは約1,160点にとどまり、未だ2,000点以上が未解明のままです。古代文字の解読作業は、依然として長く困難な課題となっています。

伝統的な歴史研究において、古代の文字の解釈は複雑なプロセスです。

最初のステップは「照合」です。これは、重複する甲骨片を整理し、検証する作業です。甲骨文字が初めて発見されて以来、約15万片の甲骨片が発掘されています。これらの甲骨片は様々な人々の間で流通し、同じ甲骨片を写した拓本が数多く残されています。これらの同じ甲骨片を写した異なる拓本は「重複甲骨片」と呼ばれ、甲骨文字の解読に不可欠な資料です。重複甲骨片は数が多く、品質もまちまちであるため、検証は主に研究者の目視に頼っており、経験に大きく依存し、時間と労力を要します。

次のステップは正式な「解釈」です。まず、古代文字の形態を詳細に観察・分析し、筆致や構造を同定します。次に、これらの特徴に基づき、古代文化、風俗、宗教に関する背景知識と組み合わせることで、各文字の本来の意味を推論します。解釈の過程では、古代文字を特定の歴史的文脈と音韻体系の中に位置づけ、当時の意味と用法を分析します。同時に、現代中国語や他の古代言語における同義語と比較し、意味の進化と語源的な関係を明らかにします。この過程では、学者は広範な専門知識を持ち、探偵のように類似事例を綿密に分析し、推論を導き出す必要があります。

幸いなことに、AI は、すべての単語を有効活用するための道のりを支援してくれます。

甲骨描写作業には、膨大なデータを比較・処理し、そこから有用な情報を抽出することが求められます。これはまさにAIの専門分野です。2022年にMicrosoft Research Asia (MRSA)で行われたプロジェクトにおいて、研究者のZhirong Wu氏は、自己教師ありディープニューラルネットワークアルゴリズムである甲骨描写アシスタント「Diviner」を学習させました。18万点のデジタル化された拓本をDivinerに入力したところ、より完全で鮮明な甲骨画像セットが得られただけでなく、いくつかの驚くべき新発見も得られました。

重厚で異なる新しいイメージ

下の画像に示すように、左側は初期の甲骨文字の拓本で、不完全な状態です。右側は後期の拓本で、甲骨文字が破損し、一部しか残っていません。拓本自体は完全ですが、非常に不完全な状態です。2つの拓本を重ね合わせることで、甲骨文字のより完全な画像が得られ、特に右上隅の甲骨文字の一部が完全に表示されるため、甲骨文字の研究に直接新たな資料を提供します。

2 つの拓本を重ね合わせることで、甲骨の完全な画像が得られました。

内容とスタイルを兼ね備えた新しいイメージ

甲骨には両面に銘文が刻まれているものもありますが、片面しか拓本化されていないものもあります。例えば、馬宝俊氏はかつて、裏面の拓本2枚を繋ぎ合わせることができることを発見しました。しかし、そのうちの1枚の甲骨の表面の図はこれまで発見されていませんでした。占師による照合と再発見の結果、次の甲骨の両面の拓本が完全に揃っており、繋ぎ合わせ修復された表面の図がようやく明らかになりました。

正面のステッチ画像は、Diviner 再補正に基づいて取得されました。

重フィルムから融合へ

左の画像は、張宇偉氏が以前に接合した2つの甲骨片です。占師による照合の結果、下側の拓本には元々、より完全な甲骨片が含まれていたことが判明しました。これにより、2つの甲骨片の接合は、3つの甲骨片の接合へと拡張されました。

甲骨の接合

ぼやけたものから鮮明なものへ

甲骨文拓本の中には品質の悪いものがあり、その文字の解読が困難で、甲骨文研究者にとって多くの問題となっています。下の写真に示すように、ぼやけた拓本の文字は、はっきりと重なり合う断片が発見されるまで判別が困難であり、これまでの多くの疑問が解消されます。

甲骨文字の解読は現在、主に専門家の手作業に頼っていますが、AIの活用により、この作業は簡素化され、効率化されることが期待されています。今年5月27日、テンセントは甲骨文字AI協働プラットフォーム「銀奇文元」を正式にリリースしました。

Yinqi Wenyuanは、甲骨文源研究の効率向上を支援する、成熟した標準化されたシステムと技術ツールの提供を目指しています。研究者は、インタラクティブな甲骨文源情報ビューアを使用することで、歴史写真、高解像度3Dモデル、デジタル拓本、強化デジタル拓本など、様々な甲骨銘文のデジタル版を並列または重ねて表示・比較することができます。

アップグレードされた銀奇文源プラットフォームは、甲骨文字研究における主要な課題である可視化と文字認識に直接取り組むための様々なツールを導入しています。甲骨は壊れやすく貴重なため、研究者は通常、直接取り扱うことができません。さらに、甲骨片が中国および世界中に散在していることも、研究をさらに複雑にしています。

長い間、研究者はそれぞれの画像を比較し、時には手書きのメモに頼って繰り返し登場する文字を見つけなければなりませんでした。これは時間と労力を要する作業でした。現在では、AI支援機能により、甲骨文字の解読効率と精度が大幅に向上しています。さらに、微細痕跡強調技術を用いることで、研究者は甲骨文字の浅い刻字を観察することができ、筆跡や甲骨の裏側に刻まれた明確な溝の詳細な分析を容易にしています。

マイクロトレース強調技術を用いて甲骨の浅い痕跡を観察する

検索を容易にするために、甲骨文字それぞれに索引が付けられており、研究者や愛好家が関連する学術論文をすばやく見つけてさらに研究を進めることができるため、甲骨文字の処理時間が大幅に短縮されます。

AIが鉛を金に変える

傷から文字を識別することが非常に価値のあることであるならば、「言葉のない本」を解読することは鉛を金に変えるおとぎ話のように思える。

ナット・フリードマン、ダニエル・グロス、ブレント・シールズが立ち上げたベスビオ・チャレンジにおいて、3人の若者はAIと協力し、エルダー・スクロールズ(ヘルクラネウム文書)の謎を解き明かしました。これらの文書は西暦79年の火山噴火によって埋もれ炭化し、1752年まで発掘されませんでした。この脆弱な文書は、少しでも不注意があれば簡単に粉々に砕けてしまうため、物理的に展開することは不可能でした。

巻物のCT画像を撮影し、機械学習技術を使って巻物を分割・識別することで、彼らは巻物を開くことなく、巻物に書かれた文字を「見た」人々になった。

元SpaceXインターンのルーク・ファリターは、機械学習モデルを亀裂パターンに基づいて訓練し、「紫」を意味するΠΟΡΦΥΡΑϹという単語の完全形を発見することに成功しました。その後、彼はユーセフとジュリアンと3人チームを結成し、エピクロス哲学に関連すると考えられる2,000以上の文字を分析しました。巻物の連続する2つの断片において、著者は、商品(例えば食料)の入手可能性が、それらがもたらす快楽に影響を与えるかどうか、またどのように影響を与えるかについて論じています。

  • エピクロスは、自然科学の分野で原子論を提唱し、後の世代の倫理学や心理学の発展に大きな影響を与えた古代ギリシャの哲学者でした。

この成果は、通常は動きが遅い古物研究の世界に火をつけ、考古学研究の新たなパラダイムを確立しました。学者たちは、この発見によって古代ギリシャ・ローマの詩、演劇、哲学に関する発見が飛躍的に増加し、その中には古代世界の重要な時代の歴史を完全に書き換えるものもあるだろうと考えています。

過去と未来:テクノロジーのゴールドラッシュ

AIは甲骨文字の解読以外にも、歴史の他の分野にも幅広い応用の可能性を秘めています。例えば、未発見の遺跡の位置を予測したり、デジタル修復・復元を行ったり、遺物の年代や起源を特定したりすることが可能になります。

研究者たちは、機械学習アルゴリズムとLiDAR(レーザー検出・測定)技術を組み合わせ、中央アメリカの森林に覆われた、これまで隠されていたマヤ文明の建造物や集落を明らかにしました。グアテマラのペテン地域では、AIがピラミッド、宮殿、土手道など、これまで知られていなかった6万点以上のマヤ文明の建造物を特定しました。

さらに、多くの人がデジタル文化遺産に精通しています。復旦大学科学考古研究所の温少青氏率いる研究チームは、古代DNA用の特殊なキャプチャープローブを用いて、北周の武帝の四肢骨サンプルから約100万の利用可能な遺伝子座位を取得し、髪、皮膚、瞳孔などの重要な特徴を復元しました。これにより、北周の武帝、宇文雍の肖像画が復元されました。

テクノロジーと歴史探究の融合は、過去と未来が融合し、人類の歴史を照らし出す新たな歴史の時代を告げるものです。今後、AIなどの新興技術がこの分野にさらに深く応用されれば、私たちはより神秘的で魅力的な歴史物語を垣間見ることができるかもしれません。

参考文献:

1.https://www.anyang.gov.cn/2025/01-02/2459358.html