ベテラン保守員の知識・経験モデルをインフラ文書理解AIに生かす

工場・プラント・ビルなどの設備は、老朽化と慢性的な保守員不足に直面している。省人化につながるリモートメンテナンスサービス、老朽設備の保守点検を高い精度で行うには、対象設備に関する高度な知識や過去の保守点検の経緯把握が必要だが――

熟練者の知識や経験が蓄積されている保守点検記録などの専門データは現状、業務に活用できるほど十分に整理されていない。文書を高精度認識する大規模な汎用言語モデルは、文書データベースを大量学習し、教師なしで提示された文章の文脈を理解する、質問応答や機械翻訳などのサービスに適用できる技術として注目を集めているが、計算規模が大きく、インフラ保守の現場では計算リソースの確保が困難だという。

東芝は、工場やプラント等で蓄積された機器の図面・仕様書や点検・トラブル記録などを高効率・高精度に認識し、保守点検の効率化を実現する文書理解AIを開発した。その詳細をNLP2023で発表する、同AIは、一般的に入手可能な大規模な汎用言語モデル(教師モデル)から効率よく一般用語を学びながら、少ない専門データを用いた別カリキュラムで適用分野の専門用語も学習する。

小規模な言語モデル(生徒モデル)の生成を実現し、少ない計算リソースで高精度に専門的な文書を理解する。同AIの有効性を、電力設備の保守点検記録に記載されたトラブルに関する表現を見つける言語解析試験(情報抽出タスク)にて検証したところ、生徒モデルの計算規模は、従来手法の半分、同AIが学習時に使用する文書量は1/100となった。

点検記録中、トラブルが発生した機器の「現象」や保守員が実施した「対策」が記載された場所を、正解率89%(実用水準:90%)で抽出できることと、学習時間は5時間(従来手法の約97%減)に短縮できることを確認したという。「攻めの保守」の実現をめざす同社は、来年には同AIの運用をグループ内事業現場で始める考えだ。