様々な装置・設備からネット経由で収集される大量の時系列データを収集する。工場や社会インフラなどの現場では、そのデータを機械学習してより高い精度で正否分類する異常検知技術が求められている。がそこでは通常、異常発生頻度が低く、精度向上に要する異常時の学習データが不足している。そのうえ、技術者が原因究明し対策を立てる場合と違い、AIの判断は新たな法整備でも懸案の「ブラックボックス問題」を抱えている。
AIがなぜ異常と判断したか――。利用者は根拠の提示が求められているという。東芝は、工場や社会インフラなどにおける設備の異常を機械学習により検知する技術において、検知精度を従来技術から9%向上させるとともに、異常を判断した根拠を提示する新たなAI「One-Class Learning Time-series Shapelets(OCLTS)」を開発した。
「OCLTS」では、正常時に特徴的な複数の経時変化を波形パターン(Shapelets)として自動抽出する。そしてこれらの正常波形パターンで算出される正常範囲と、検査時の波形データとを比較し、正常範囲からの逸脱を設備異常と判断する。これにより、AIがあらゆる異常状態を経験せずとも設備の異常を検知でき、波形の比較において差異が出た時期とその大きさと形状から、異常発生の原因究明に繋げることが可能となる。
AIアルゴリズムのひとつOne-Class Support Vector Machine(OCSVM)に基づき正常と異常の分類を学習する。「OCLTS」は、分類境界が複雑な場合にも適用可能。学習アルゴリズムの高速化により、これまで時系列の長さの二乗分必要だった計算量を、時系列の長さの一乗分にまで大幅に削減し、より短時間で学習させられるようにもなった。
サイバー・フィジカル・システム(参考資料PDF)を具現化する、今回の技術により、特に異常を判断した根拠の説明性が求められる工場・社会インフラ設備の異常検知精度を向上でき、その稼働率向上と保守管理コストの削減に貢献すると期待される。稀にしか異常が発生しない場合でも、設備に配置した多数のセンサで収集する正常時の時系列データのみから異常検知モデルを構築し、未知の異常を含め高精度に検知する。
正常時に繰り返し現れる部分的な波形パターン(正常波形パターン)を抽出し、同パターンからの差異に基づき異常検知することで、異常と判定した根拠を提示できる説明性の高さを実現した。同社はこの技術の詳細を米ワシントン州シアトルで開催中の"IEEE BIG DATA 2018"にて発表した。