モノのインターネット(IoT)の世界では、クラウドAIに仕事をさせてその結果をまたネット経由で入手するよりも、利用現場で即座に推論・分析ができるに越したことはない――が、小さなエッジAIデバイスは能力不足やコストが課題となる。そこで、インテリジェンスを要求する画像解析・IoTアプリ向けにVWW(Visual Wake Words:参考情報コーネル大学arXiv.org)などが提案されている。
今月19日(米国西海岸時間)、Maximと、IoTアプリ向けAIを専門とするAizipは、MaximのMAX78000ニューラルネットワークマイクロコントローラがAizipのVWWモデルを使用することで、画像内の人間を0.7ミリジュール(mJ)/推論で検出可能になったと発表した(デモ動画)。これにより、ビルの電力管理やスマートセキュリティカメラなど、人の存在を検出するバッテリ動作型IoTシステムの駆動時間が延長されるという。
MAX78000は、従来のソリューションの100分の1以下の電力でAI推論を実行し、エッジAIアプリの駆動時間を大幅に伸ばす。混合精度VWWネットワークは画像・ビデオアプリ向けDNN「Aizip Intelligent Vision」シリーズの一部で、85%以上の人認識精度を実現する。
効率的なAIモデルと低電力SoCによって推論エネルギーを0.7mJに低減。リチウム単3電池一個で1,300万回の推論が可能。高度なモデル圧縮によって、低コスト機器でも、高精度スマートビジョンが達成されるという。