テンセント、甲骨文字に隠された意味の解読にAIを導入

お知らせ

Corporate

オンライン研究プラットフォーム「Oracle Bones Corpus」、研究者や愛好家からの投稿を歓迎

テンセントは本日、Oracle Bones Corpus(殷契文渊)の開設を発表しました。これは、甲骨文字の研究者や愛好家のためのオンライン研究プラットフォームとデータベースです。この刷新されたウェブサイトは、浅い刻印を視覚化するための新しい革新的なツールを提供するだけでなく、字体を現代中国語の文字にマッピングする際の効率を高めるために人工知能(AI)を採用しています。簡体字で利用可能なこのプラットフォームは、現在こちらからご覧いただけます。

20世紀初頭に初めて発見された甲骨は、数千年前にさかのぼる中国文字の最古の反復を記録しています。現在までに約16万個の甲骨が発見され、そこから約4500字の固有の文字が見つかっています。大きな進展が見られる一方で、文字の解読は依然として難題です。発見された文字のうち、現代の文字と照合できたのは半分にもいたりません(約1500文字)。

Oracle Bones Corpusは、効果的な研究を行うための成熟した標準化されたシステムと技術的ツールを提供することを目的としています。このデータベースにより、研究者は、歴史的な写真、高解像度の3Dモデル、デジタル複製、拓本など、さまざまなデジタル化されたオラクルボーンを並べて、あるいはインタラクティブなビューアで重ねて、調べたり比較したりすることができます。

新しいアップデートにより、Oracle Bones Corpusは、甲骨の研究に関連する主な困難、すなわち視覚化と文字認識に直接対処するツールを導入しました。甲骨は壊れやすいため、しばしば取り扱いが禁止されています。また、破片は中国や世界中に散らばっているため、アクセスはさらに制限されている状態です。長い間、研究者は拓本や写真複写に頼らざるを得ませんでしたが、これらの方法で作成された記録の質は現代の期待には及びません。テンセントのインデントハイライト機能は、甲骨上の浅い彫刻の視認性を高めることで解決策を提供します。これにより、字体を形成するストロークや、背面に刻まれた溝を詳細に分析することができます。

文字認識のために、研究者たちはこれまでそれぞれの画像を苦労して比較し、時には手書きのメモに頼って、繰り返し現れる字体を見つけなければなりませんでした。それが、このAIの支援により、古代中国語文字の解読の効率と精度が大幅に向上しました。さらに、文字は簡単に検索できるようにインデックス化されており、研究者や関心のあるユーザーは、さらなる研究のために関連する学術論文を素早く見つけることができます。この技術を活用することで、研究者は甲骨の処理時間を大幅に短縮することができます。

この取り組みについて、テンセントの持続可能な社会的価値組織、デジタル文化ラボの責任者であるZhan Shu氏は、次のように述べています。「Oracle Bones Corpusによって、甲骨文字研究のすべての関係者が共通の目標に向かって協力するためのプラットフォームを確立しました。より多くの甲骨文字がデジタル化され、研究者や人類学の愛好家がこれらの古文書の秘密を解読することを期待しています。」

甲骨文字の研究を促進するため、テンセントは教育用Weixinミニプログラム「Amazing Oracle Bones(了不起的甲骨文)」も共同開発しました。このミニプログラムは、今日の言葉、3Dモデルの閲覧、甲骨文字のトリビアクイズなど、楽しく双方向的な体験を通じて、オラクルボーン研究に対する一般の人々の認識と関心を高めることを目的としています。さらに、ユーザーはミニプログラムを通じて、未確認文字の解釈を研究者に提出し、現在進行中の解読作業に貢献することもできます。

Oracle Bones Corpus(https://www.jgwlbq.org.cn/home)とAmazing Oracle Bonesは、いずれも現在公開されています。Amazing Oracle Bones Mini Programにアクセスするには、Weixinアプリで以下のコードをスキャンしてください。

Share

※こちらに掲載されているリリースは、配信当時の情報も含みます。キャンペーン開催期間終了等、中には時効となっている情報も含みますので、ご注意ください。