arrow-up icon
Reading:
スーパーコンピュータ「富岳」がGraph500において3期連続で世界第1位を獲得
Share:

スーパーコンピュータ「富岳」がGraph500において3期連続で世界第1位を獲得

2021-06-28
プレスリリース

ビッグデータの処理で重要となるグラフ解析で最高レベルの評価

理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループは、スーパーコンピュータ「富岳」[1]のフルスペックを用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」において、世界第1位を3期連続で獲得しました。
このランキングは、HPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2021」の開催に合わせて、Graph500 Committeeから7月1日(日本時間7月1日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要な指標です。
※「富岳」の第1位については7月1日以前の報道解禁になります。

スーパーコンピュータ「富岳」

※共同研究グループ

理化学研究所 計算科学研究センター

プログラミング環境研究チーム

チームリーダー 佐藤 三久(さとう みつひさ)

上級研究員 児玉 祐悦(こだま ゆうえつ)

技師 中尾 昌広(なかお まさひろ)

九州大学 マス・フォア・インダストリ研究所

教授 藤澤 克樹(ふじさわ かつき)

株式会社フィックスターズ

エグゼクティブエンジニア 上野 晃司(うえの こうじ)

1.「富岳」測定結果

共同研究グループは、「富岳」のフルスペックである158,976ノード[2](432筐体)を用いて、通信性能の最適化等を行うことによって、約2.2兆個の頂点と35.2兆個の枝から構成される超大規模グラフに対する幅優先探索問題を調和平均0.34秒で解きました。「Graph500」のスコアは、102,955GTEPS(ギガテップス)[3]です。
なお、2021年6月時点の「Graph500」のランキング第2位は、中国の「Sunway TaihuLight」で、測定結果は23,756GTEPSです。すなわち、今回「富岳」は第2位と約4倍以上の性能差をつけたことになります。

<関連リンク>
Graph500ランキング
https://graph500.org

2.Graph500について

実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービスなどでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することによって新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用を持つグラフ解析の性能を競うのが「Graph500」です。「Graph500」は2010年に始まり、そのランキングは年に2回(6月と11月)更新されます。

「Graph500」では1兆個の頂点を超えるような大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(3)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)

  1. 複数のノード間におけるグラフデータの効率的な分割方法
  2. 冗長なグラフ探索を削減するアルゴリズム
  3. スーパーコンピュータの大規模ネットワークにおける通信性能最適化

「Graph500」の第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を持っていることを実証したものであり、幅広い分野のアプリケーションに対応できるという「富岳」の汎用性の高さを示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。共同研究グループはさらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組んでいく予定です。
今回の「富岳」での成果である大規模グラフ解析プログラムは以下のGitHubレポジトリより公開を行っています。

<関連リンク>
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/

大規模グラフ解析プログラムのGitHubレポジトリ
https://github.com/mnakao/graph500/「富岳」での成果

注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1:科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2:科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3:大規模グラフ解析プログラムのGitHubレポジトリ
https://github.com/suzumura/graph500/
<参考文献>
1: Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35, 2017.
2: Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , “Extreme scale breadth-first search on supercomputers”. 2016 IEEE International Conference on Big Data (Big Data): 1040–1047. 2016.

3.補足説明

  • [1] スーパーコンピュータ「富岳(ふがく)」
    スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用が開始された。
    「富岳」は”富士山”の異名で、富士山の高さがスーパーコンピュータ「富岳」の性能の高さを表し、また富士山の裾野の広がりがスーパーコンピュータ「富岳」のユーザーの拡がりを意味する。また、”富士山”は海外での知名度も高く、名称として相応しいこと、さらにはスーパーコンピュータの名称は山にちなんだ名称の潮流があることなどから理研が選考した。
  • [2] ノード
    スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、1つのCPU(中央演算装置)および32GiB(ギビバイト)のメモリから構成される。
  • [3] GTEPS(ギガテップス)
    TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間あたりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒あたりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
  • [4] Society5.0
    狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において我が国が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指すこととしている。
  • [5] 持続可能な開発目標(SDGs)
    2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴール、169のターゲットから構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本としても積極的に取り組んでいる。(外務省ホームページから一部改変して転載)

この記事をシェア:
本件に関するお問い合わせ

株式会社フィックスターズ 広報担当