2019年7月5日 データセットの提供を開始 情報研が国内最大級の蓄積を学術研究に

文部科学省の情報・システム研究機構国立情報学研究所(NII)と調査データ会社の(株)オリコンは、同社が保有する顧客満足度調査データを学術研究分野で活用促進することを目指して提携し、7月1日から「オリコンデータセット」として提供を開始した。

オリコンは、実際の商品やサービスを利用したユーザーに対する顧客満足度調査を2006年度から実施し、現在までに約100産業について累計200万以上からの回答を得て、日本最大級の調査データを蓄積してきた。

今回提供する「オリコンデータセット」は、蓄積してきた調査データをできるだけそのまま学術研究コミュニティー向けに、情報研のデータセット共同利用研究開発センターが運営する情報学研究データリポジトリを通じて提供するもので、新たな技術・サービスの発展やビジネスチャンスの創出、データサイエンティスト育成などへの貢献が期待される。

情報研は2010年(平成22年)に情報学研究データリポジトリ(IDR)を設置し、さまざまな民間企業や研究機関が保有する各種のデータセットを受入れ、研究コミュニティーに提供してきた。

2015年(平成27年)4月には、情報学研究に有用なデータセットを整備して研究者に提供するとともにデータセットの構築と活用基盤に関する研究開発を行うデータセット共同利用研究開発センターを設置し、研究コミュニティーへのデータセットの提供をさらに強化するとともに、大規模な実データと最先端情報技術を活用したデータサイエンス研究の加速に取り組んでいる。

 

7月スタート、順次追加

提供を開始したオリコンデータセットは、まず当初は2016年以降の67万人分の調査データからスタート。準備が整いしだい順次追加していく。データセットに含まれる膨大なデータは、産業数、サービス、企業数、調査サンプル数の点で日本最大級であるだけでなく、綿密に設計・実施されたアンケートによる調査データという点に特徴があり、商品やサービスに対して実際に顧客が評価したリアルな顧客満足度のデータとなっている。

調査データの取得には、回答するユーザーの属性分布を統計的に意味があるサンプルとすることでプラスの評価とマイナスの評価を系統的に収集できるなど、データの品質をコントロールできるアンケート手法が用いられているため、AIや機械学習の教師データとしても利用しやすいものとなっている。

 

若手研究者ら人材育成にも

このデータセットを学術コミュニティーに提供して利用可能とすることにより、ビッグデータ分析、AIや機械学習の手法の開発にとどまらず、実際の顧客満足度データの活用を通じてデータ収集段階では想定されていなかったデータ価値が発見されることが期待できる。

マーケティングはもちろんのこと、それ以外の多様な学術分野で利用することで研究が進展し、あるいは新たな技術・サービスの創出へとつながることも期待している。

さらに、こうした実データで研究するチャンスを大学生・大学院生を含む若手研究者へ提供することで、データサイエンティストといった人材育成にも貢献できるという。

情報研はこれまでにIDRを通じて、口コミなどのユーザー投稿型データやユーザー行動履歴データなどのデータセットを提供してきたが、オリコンデータセットはこれらとは切り口や収集方法が異なるため、相補的にデータを活用することで新たな研究の展開も期待される。

リアルなデータは学術研究目的であるとしても個人情報やプライバシーに関連して適正管理が求められるため、従来は研究者にデータ提供する際に障害となっていたが、学術コミュニティーの一員である情報研が窓口となって、学術研究目的での利用であることを確認し利用条件などを遵守することに同意した研究者にデータセットを提供する。こうした仕組みにより、オリコンは多分野の多数の研究者にデータを提供できることになり、学術コミュニティーは現実に即したデータを利用した実践的な研究が可能になる。


株式会社官庁通信社
〒101-0041 東京都千代田区神田須田町2-13-14
--総務部--TEL 03-3251-5751 FAX 03-3251-5753
--編集部--TEL 03-3251-5755 FAX 03-3251-5754

Copyright 株式会社官庁通信社 All Rights Reserved.