それらは人と同等以上の性能を発揮する一方で、学習時には想定外だった照明や視点などの環境・条件の変化により、見え方に大きな違いが生じた際――少ない情報で物事を幅広く把握できる人間とは異なり、未知のデータに対して――認識精度が大幅に低下する。AIは、同じ物でも色合いや角度など条件の異なる様々なデータを網羅的に学習させることが難しい。従来、認識精度の向上には限界があったという。
富士通と、米国MIT CBMMは、学習時と傾向の大きく異なる未知(out-of-distribution:OOD)のデータに対しても、AIが高い認識精度を示す技術を共同開発した。今回、人の認知特性と脳の構造に着想を得て――独自に算出したAIの画像認識度合を示す指標を活用――DNNを形や色などの属性ごとのモジュールに分割して学習させることで、AIがOODデータを高精度に認識する技術を具現化した。
同技術を適用したAIを、画像認識精度を測る標準ベンチマーク「CLEVR-CoGenT」(スタンフォード大学製)で評価した結果、世界一の精度を達成した。成果の一部は、AI分野で最も権威のある国際会議「NeurIPS 2021」にて今月8日に発表された(オンラインイベントスケジュール)。
今後、同技術の活用により、様々な観測条件の変化に対応できる交通監視AIや、多種多様な病変を正しく認識できる画像診断AIなどの実現が期待されるという。両者は同技術をさらに高度化してより人間に近い柔軟な判断を可能とするAIを開発し、モノづくりや医療など幅広い分野への展開を目指していく考えだ。