■ポイント□
〇プライバシーの確保、ラベル付けコストなど商業利用の際の課題を解消
〇自動運転や医療、物流などの応用に期待
産業技術総合研究所(産総研)は、数式から自動生成した大規模画像データセットを用いて人工知能(AI)の画像認識モデル(学習済みモデル)を構築する手法を世界で初めて開発した。国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の「人と共に進化する次世代人工知能に関する技術開発事業」で取り組んだもの。
この手法は、AIが学習で使用する大量の実画像やそのプライバシーの確保、ラベル付けコストなど商業利用の際の課題を解消するとともに、実画像や人の判断を経た教師ラベルを用いる現在の手法と同程度以上の画像認識精度を実現している。今後、自動運転や医療、物流などさまざまな環境のAI構築で応用が期待できる。
人工知能(AI)技術の導入が期待される分野は多様で、特に画像認識の技術は注目を集めている。しかし、製造や医療の現場などでは、AIの学習に必要な大量のデータを収集することが不可能なケースや、高いコストがかかるケースがあり、AI技術の導入にあたって障壁となっている。
この障壁を克服する手段の一つとして、大量のさまざまな実画像を用いてAIが事前に学習した画像認識モデル(学習済みモデル)を活用する取り組みが進んでいるが、学習させる画像によってはプライバシー侵害や、不適切に付与された教師ラベル(※)が人種によって不公平な認識結果を出力するなど、データの透明性に関する問題があり、商業利用の際の課題となりつつある。
このため、プライバシー侵害や不公平な認識結果など画像データ関連の問題を解決しつつ従来と同程度以上の認識精度を実現する学習済みモデルの開発は、AI分野で喫緊の課題となっていた。
そこで今回、産総研は、事前の学習で実画像を一切用いず、数式から画像パターンや教師ラベルを自動で生成することでラベル付けのコストを削減し、実画像のデータ数や倫理的な問題、権利関係を気にせずAIの画像認識モデル(学習済みモデル)を構築する手法を世界で初めて開発した。
さらに、この学習済みモデルで、画像認識性能のベンチマークに活用されるImageNetの画像データセットを認識させたところ、実画像や人の判断を経た教師ラベルを用いる現在の手法よりも精度が優れており、実利用できるレベルに達していることを確認できた。
データセットおよび学習済みモデルはHPで公開している。
※教師タグ:深層学習のモデルを学習できる形式にするために、画像に対して付与したタグ情報