スマートファクトリーの実現に向けて、工場内のIoT(モノのインターネット)化が進んでおり、設備の保守点検についてもセンサーなどが利用され始めている。一方、センサーを使わない音を利用した設備点検においては、従来、熟練者が音を聴いて経験に基づき設備の稼働状態を診断する方法が一般的。熟練者不足などにより、自動診断サービスのニーズが高まっている。
しかし、工場内など様々な設備に囲まれた環境では、環境音や反響音など多様な種類の雑音が混在しているため、音に基づく正確な状況認識が難しく、設備の稼働状態を高精度に把握することが困難だった。
日立は、様々な観点で音を分解することで、高精度に状況を認識できるAI技術を開発。この技術では、まず、複数のマイクロホンで音を録音し、マイクロホン間での音が到達する時間差から推定される音源の方向や、音色の違いから推測される反響音かどうかなどの複数の観点に基づいて、雑音が混ざった音を分解する。
さらに、複数のディープニューラルネットワーク(DNN)に分解した音をそれぞれ入力し、設備や人などが置かれている状況と一致する可能性(確率)をそれぞれ計算。最後にその計算結果の多数決により、総合的な状況認識結果を出力する。
同社によると、それぞれのDNNが受け持っている一つの観点だけに頼ると雑音に影響されやすいという問題があるが、複数のDNNの多数決による結果を確認することで雑音に影響されにくくなるという。これにより、多様な種類の雑音が存在する環境でも高精度な状況認識を可能にする。
今回、日立は、「IEEE AASP TC」が公認する、音響認識分野で最大の国際コンペティション「DCASE 2018 ChallengeのTask 5」において第1位のスコアを獲得し、技術の効果を確認している。
また、音に基づいて設備の状態を自動診断するサービスや人の活動状態を自動認識する見守りサービスなどへの応用が期待される。今後、日立は機能向上などの開発を進め、実用化を目指す。