通常、ディープラーニングなどを用いたAI(人工知能)は、大量の実績データから学習することで予測や判断を行う。大量のデータが入手できない場合には、正確な予測や判断が難しくなるという課題がある。
日立製作所は、複数のAIを相互接続したAI群でビジネスを表現し、AI群同士がコンピューター上で自己競争を行うことで、人が用意した実績データに頼らずに学習を行うビジネス向けのAI技術を開発した。
今回開発したAI技術は、相互接続された複数のAIエージェントのそれぞれの学習を管理し、各AIエージェントの学習が、相互に悪影響を与えることを防止する学習管理機能を備えている。この機能は、各AIエージェントの学習のタイミングの制御を担い、学習の初期段階ではひとつのAIエージェントのみに学習させ、徐々に学習するAIエージェントの数を増やす。これにより、AIエージェントが同時に学習する時に生じる競合を避け、AIエージェント同士を協調させ、その結果、AI群のアウトカムの向上につながるという。
また、AI群を構成するAIエージェントが何度も学習を繰り返すと、各AIエージェントの学習結果(モデル))が偏ることでAI群のアウトカムが個別最適の状態に陥り、アウトカムの向上が停滞する現象が発生する。そこで、コンピューター上に複数生成されたAI群の間で、AIエージェント同士のモデルのパラメータを掛け合わせる(交叉)ことで、新たなモデルを持つAIエージェントを生成し、新たなAI群を構築する。
サプライチェーン上の複数の企業によるビジネスを模擬した「ビールゲーム」にこの技術を適用したところ、人の経験に基づいた判断と比べて、在庫や欠品による損失を約4分の1に低減できることを確認した。
すでに囲碁などの対戦型ゲームでは、自己競争によるAIの学習の有効性が示されていたが、今回、不確定要素の多いビジネスの問題についても、自己競争を活用した学習の有効性を示すことができた。