大量の自然言語データを高精度分類、システム連携もできる

多様なデータを収集して分析する。企業では昨今、それをビジネスの価値創出や差別化につなげるデジタルトランスフォーメーション(DX)の動きが加速している。

その一方で、分析に要するAI(人工知能)の導入や活用において、AIを扱うためのノウハウの獲得や学習させるための教師データの準備に時間を取られるなどの課題が出てきているという。日立ソリューションズは、Google AI ResearchがGitHubに公開している「BERT」でAIエンジンを強化した「活文 知的情報マイニング」の最新版を12月2日に販売開始する。

「BERT」は少量の教師データによる追加学習で高い精度が得られる自然言語処理モデル(成果論文@arXiv.org)であり、「活文 知的情報マイニング」は、大量のテキストデータを自然言語処理AIで分析・分類することで、業務の効率化を成就する製品。BERTでパワーアップした最新版では、大量のWeb公開言語データを事前学習したモデルに、企業が所有する教師データを学習させる。ゆえにより高精度(社内の実証実験で精度90%以上)なテキスト分類を実現できる。

業務システムと連携しやすくするためのAPIや、導入後の運用コマンドに加え、テキスト分類処理を複数同時に行い、結果の多数決をとる形でさらに精度を上げる「アンサンブル学習」のしくみも提供。さらに、日立ソリューションズの専門技術者がテキスト分類の業務適用を支援する。企業は、一層高精度なテキスト分類を業務に適用できるようになる。

たとえば、出荷後の商品に対する顧客からの問合せ内容(テキスト)をもとに、重大な問題の可能性の有無を見極める。品質・サービスの改善業務において、人によって異なる判断の平準化をこれまで以上に達成できるという。同社は今後も、大量のデータを価値創出につなげるソリューションを提供することで、顧客のDX推進を支援していく構えだ。