2020年10月26日 史的文字DB連携システムを公開 東大史料編纂所・奈文研など国内外6機関が連携

東京大学史料編纂所と奈良文化財研究所など国内5機関と台湾の研究所が参画する『史的文字データベース(DB)連携システム』が、公開された。同システムの公開に向け、東大史料編纂所、奈良文財研をはじめ、国文学研究資料館、国立国語研究所、京都大人文科学研究所、中央研究院歴史語言研究所/数位文化研究中心(台湾)が、それぞれが蓄積してきた歴史的文字画像データについて、相互に連携運用が可能となるよう協議・開発を重ねてきた。今回、情報運用の方法・仕様に関する指針に合意とするともに、機関や国境の壁を越えたデータベース連携システムが本格稼働した。

10月13日に開催された記者会見では、次の3点に中心とした発表が行われた。

 

〇各機関の対等なデータ連携体制の確立

これまで人類が書き写してきたさまざまな文字の画像(主として漢字)を、誰もが利用可能なオープンデータにすることを目的に、その公開と共有を円滑に進めるための宣言文「IIIFに基づく歴史的文字研究資源情報と公開の指針」を共同作成し、現在国内外6機関が賛同。

 

〇機関間連携によるデータ検索インターフェイスの構築・公開

同宣言に従い「オープンデータに関する仕様」を策定し、各機関が有する字形データを横断的に検索するためのポータルサイトを構築、公開。独立した人文系研究機関間では初めての取り組みであり、さらに国境を越えたアジア規模の広がりを展望する。

 

〇機関の特性に応じた多様で大量のコンテンツのオープンリソース化

歴史学(日本史学・東洋史学・考古学)・国文学・国語学など多様な専門研究のなかで蓄積された字形データ群は、簡牘(かんとく)・木簡・文書・記録・経典・版本などさまざまな媒体から集積されており、中国漢代から日本の近世に至る150万件余の字形画像からなる。それを誰もが二次利用可能なオープンリソースとして公開。

 

東大史料編纂所と奈文研は、2009年からそれぞれが集積した文形データを横断検索することができるシステムを構築・公開してきた。関連するデータベース(DB)のアクセス数は年間200万件に達するなど、歴史学研究上の基礎的インフラとして広く認識されているが、画像やメタデータの汎用性が飛躍的に高まっていたことで、さらに広範なDB連携ができる環境が整いつつある。

そこで今回、東大史料編纂所等奈文研と同様に歴史的な字形データを集積している4機関と共同して連携検索用ポータルサイトを設け、一挙に検索可能範囲を拡大。それぞれの機関が自らの専門研究を進めるうえで集積した字形データは、中国・日本を覆い、時代も紀元前後から19世紀に及ぶ。データ総数は約150万件に達し、東アジア漢字文化圏で最大の文字コレクションと言っても過言ではない。

さらにこの連携ポータルを通じて発信される情報は、すべてオープンデータを原則としており、ユーザーは自由にデータを2次利用することが可能となる。

東大史料編纂所等では、この取組を、人文学研究の基盤を一層強化するばかりでなく、文字の持つ多様な魅力を広く社会一般に示すものになると意義を強調。今後、さらに連携の拡張を図るとともに、ポータルの機能を多様化・高度化することで、学術資源としての文字データの有用性を発信することへの期待感を表明している。


株式会社官庁通信社
〒101-0041 東京都千代田区神田須田町2-13-14
--総務部--TEL 03-3251-5751 FAX 03-3251-5753
--編集部--TEL 03-3251-5755 FAX 03-3251-5754

Copyright 株式会社官庁通信社 All Rights Reserved.