東京大学の研究グループは、市販のパソコンやスマートフォンに標準搭載されているWebブラウザ上で、ディープニューラルネットワーク(DNN)を高速(世界最速)に実行できるソフトウェアフレームワーク「WebDNN」を開発した。計算速度の最適化やWebの最新技術の活用により、画像認識処理で従来の約50倍の実行速度を実現。画像生成等の人工知能研究の最新の成果を誰でも容易に試せるようにする基盤として有用で、さまざまなデモンストレーションやアプリケーションへの応用が期待される。
開発したのは、大学院情報理工学系研究科知能機械情報学専攻の原田達也教授、日髙雅俊大学院生、木倉悠一郎大学院生、牛久祥孝講師。
DNN、高い計算負荷が問題
DNNはここ数年急速に発展を遂げている人工知能の一形態で、画像や音声の認識や生成に有効な手法。しかしながら計算負荷が高く、Webサービスに組み込むにはサービス提供者側がユーザ数に応じた大量の計算機を用意することが必要となり、コストが高くなる。
別の手段として、DNNの処理を行う機能を組み込んだ専用アプリケーションをユーザに配布し、端末(パソコンやスマートフォン等)上で計算を行うことも考えられるが、この場合、サービス提供者のコストは下がるもののユーザは専用アプリケーションのインストールという手間がかかり、気軽に試すことが難しくなる。
これらの問題を解決する手段として、Webページの中にDNNの処理を行うソフトウェアを組み込み、Webブラウザでこれを開いたユーザの端末上で計算処理を行わせるというアイデアが以前から提案されていた。
しかし、このアイデアに基づいて作られた既存のシステムは処理速度が遅く、実用的なサービスを提供することが難しいという課題があった。
プライバシー保護の安全性も向上
この研究では、パソコンやスマートフォンのWebブラウザ上で、DNNを大幅に高速処理することのできるソフトウェアフレームワーク「WebDNN」を開発した。WebDNNを用いることにより、DNNを用いたWebサービスを低コストに提供できるようになる。
ユーザはただWebサービスのURLを開くだけで済み、手間が増えることはない。また、処理が端末内で完結することから、処理対象の写真等をサービス提供者側に送信する必要がなくなり、プライバシー保護の観点での安全性も高まる。
WebDNNでは、DNNをWebブラウザ上で高速に実行することを目的に、①実行結果が変わらない範囲での計算量の削減、②端末の性能を最大限引き出すためのWeb最新規格の活用―の2点の技術を開発した。
計算量の削減の面では、例えば「2×3×変数」という計算が必要な場合、「2×3」の部分は事前に計算しておき、「6×変数」という処理に変換(最適化)できる。この例では、計算時間が短縮されるだけでなく、処理に必要なデータのダウンロード時間の短縮にもつながる。WebDNNにはこのような変換ルールが10以上組み込まれている。
DL時間の削減なども期待
端末の性能を引き出す面では、アップル社のスマホ『iPhone』に標準登録されているWebブラウザSafariの現バージョンに搭載の新規格「WebGPU」の活用が挙げられる。この規格はすでに普及している「WebGL」規格に対してコンピュータグラフィックスの高速化を目指すものだが、DNNの処理でも大幅な高速化をもたらすことがわかった。