昨今、産業および医療分野などで画像・音声認識に優れたAI(人工知能)アルゴリズムの一種、ディープラーニング(深層学習)の活用が進んでいる。ニューラルネットワークの多層化により認識性能を向上させたそのモデルは現在、大量の演算リソースや電力を必要とする。
IoTの発展とともに、つながるクルマやスマート○○といった多様なエッジデバイスが登場する中、上記モデルの軽量化、限られた演算資源で高性能を発揮するモデルが求められていて、これまでにチャネル・プルーニング手法(畳み込み層から冗長チャネルを削減し、演算・パラメタ・メモリを削減する技術)が提案されている。同手法は、層毎の削減率設定を要し、手間がかかるうえに全体最適な削減にならない、課題があったという。
NEDOとOKIは、多様な分岐・合流のあるネットワーク構造を含むディープラーニングモデルにおいて、認識性能を維持しつつ、メモリ使用量や消費電力を低減する新たなモデル軽量化技術を開発した。これにより、既存のベンチマーク(高精度モデル)に対し、認識精度の劣化を約1%に抑えつつ、演算量を約80%削減することに成功した。
新開発の軽量化手法は、分岐・合流経路を含むモデルに柔軟に対応できるアーキテクチャであり、分岐部において、単一チャネルに複数のアテンション・モジュールを導入――これにより、複数経路のチャネルの重要度を全体最適で推定する。経路ごとに異なるチャネル構成の不一致を整合する仕組みと、学習過程の詳細な分析に基づく誤差伝播量の制御方法も開発し、多様なモデルに対して認識性能を最大限に引き出した。
両者の開発はNEDO事業(参考資料:経産省PDF)のテーマに沿って続けられてきたものであり、エッジAIのさらなる高度化と効率化が計画されていて、多様で高度なデータ利活用社会の実現への貢献が見込まれる。今回の成果は国際学会「BMVC2019」にて発表される。