九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通(株)、(株)フィックスターズによる国際共同研究グループは、去る6月21日に公開された最新のビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」で、スーパーコンピュータ『京(けい)』による解析結果で、昨年11月に続き5期連続(通算6期)で第1位を獲得した。

大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析で重要となるもので、『京』は正式運用開始から5年以上が経過しているが、今回のランキング結果によって、現在でもビッグデータ解析に関して世界トップクラスの極めて高い能力を有することが実証された。今後、成果の広範な普及のため、プログラムをオープンソース化し、大規模高性能グラフ処理のグローバルスタンダードを確立する方針。

この研究の一部は、科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」(研究総括:佐藤 三久理研計算科学研究機構)での研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」(研究代表者:藤澤克樹氏(九州大)、拠点代表者:鈴村豊太郎氏(バルセロナ・スーパーコンピューティング・センター、今年3月終了)と「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」(研究総括:喜連川 優氏(国立情報学研究所))での研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」(研究代表者:松岡 聡氏(東京工業大))の一環として行われた。

ここ数年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析(グラフ解析)が必要とされている。

例えば、インターネット上のソーシャルサービスなどでは、〝誰が誰とつながっているか〟といった関連性のある大量のデータを解析するときにグラフ解析が使われる。また、サイバーセキュリティや金融取引の安全性担保のような社会的課題に加えて、脳神経科学における神経機能の解析やタンパク質の相互作用分析などの科学分野でもグラフ解析は用いられ、応用範囲が大きく広がっている。

こうしたグラフ解析の性能を競うのが、2010年に開始されたスパコンランキング「Graph500」。規則的な行列演算である連立一次方程式を解く計算速度でスパコンを評価するTOP500では、「京」は2011年(6月、11月)に第1位、その後、今年6月19日に公表された最新のランキングでも第8位につけている。一方、Graph500ではグラフの幅優先探索(1秒間にグラフのたどった枝の数)という複雑な計算を行う速度で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められる。

『京』は、国際共同研究グループによる「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」と「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」の二つの研究プロジェクトによってアルゴリズムやプログラムの開発が行われ、2014年6月に1万7977GTEPSの性能を達成し、第1位、また『京』のシステム全体を効率良く利用可能にするアルゴリズムの改良が行われ、2倍近く性能を向上させ、2015年7月に3万8621GTEPSを達成し、第1位を獲得した。

さらに今回のランキングでも、この記録は中国のスパコン『神威太湖之光』等の新しいシステムに比べても大幅に高いスコアであり、世界第1位を5期連続(通算6期)で獲得した。

研究グループでは今後は、大規模グラフ解析では、アルゴリズムおよびプログラムの開発・実装によって性能が飛躍的に向上する可能性を示しており、研究グループでは今後もさらなる性能向上を目指す。また、実社会の課題解決や科学分野の基盤技術へ貢献すべく、スーパーコンピュータ上でさまざまな大規模グラフ解析アルゴリズムおよびプログラムを研究開発する方針だ。