自動運転や広告推薦などに活かせるGNNの計算速度と効率化を両立

このAI技術の活用が急進展している。人間同士のつながりや道路網様の複雑な関係性を表す「グラフデータ」を扱うのに優れたグラフニューラルネットワーク (GNN)はしかし、扱うデータが大きくなると、計算に必要な情報量が巨大になり、計算処理量・消費エネルギーが増大する課題があった。

半導体チップ上のバッファサイズ削減のためにグラフパーティショニング手法を導入しても、細粒度にすると、分割された塊同士を繋ぐエッジ(接続情報)数が増え、メインメモリへのアクセス回数増加で全体の性能悪化を招くーージレンマもあったという。東京科学大学総合研究院AIコンピューティング研究ユニットの研究チームは、大規模なグラフデータを効率的に処理できる新しいAIアクセラレータ「BingoGCN」を開発した。

BingoGCNは、上記課題を解決するために、CMQとSLT理論という二つの新しい技術を搭載している。CMQは、グラフデータを小さな塊(パーティション)に分割して処理する際に、パーティション間でやり取りされる情報を「オンラインベクトル量子化」という技術で要約することにより、不規則なメモリアクセスを大幅に減らし、処理の精度を保ちながら効率を向上させる。

一方、SLT理論ではAIモデルの計算に必要な「重み」と呼ばれるパラメータを、必要な時に必要な分だけチップ上で生成することにより、メモリ使用量を削減し、計算効率を大幅に高める。BingoGCNは、これらの技術を組み合わせることで、従来難しかった細かく分割されたグラフデータ上でも高い効率でGNNの推論を行うことを可能にした。

ソーシャルネットワーク分析や自動運転といった身の回りの多彩なサービスを支えるGNNの性能を飛躍的に向上させる。FPGAへの実装検証で実用性も裏付けられた。今回の成果は計算機アーキテクチャ分野の最高峰会議ISCA '25で発表される。