40億件のWebページから回答を生成する音声対話システム

情報通信研究機構(NICT)ユニバーサルコミュニケーション研究所 データ駆動知能システム研究センターは、大規模Web情報分析システム「WISDOM X」を用いて、ユーザーの多様な音声入力に応答する次世代音声対話システム「WEKDA」の開発に取り組んでいる。

WEKDAは、利用者が自然な文を入力すると、入力文の意図を解析し、40億件のWebページからNICTのWISDOM Xが提供する知識を基に、様々な話題やトピックに関して対話を展開できるシステム。例えば、「煮物が食べたい」といった日常に関する雑談から「臓器移植って難しいね」といった学術的な話まで幅広く応答することができる。

NICTによると、従来の対話システムでは、例えば「臓器移植って難しいね」という発話(入力文)に対して、「臓器移植は高度な技術ですね」というような当たり前の情報を基にした応答が中心だったという。WEKDAは、WISDOM Xを活用することで「臓器移植で最大の壁となるのが、人体の免疫機構による拒絶反応だ」というような、ユーザーが知らない可能性の高い情報も応答として返す。また、回答を生成する際に基にした情報のURLを「情報源」として表示するとともに、URLをクリックすることにより、回答が抽出されたページや元のテキストを確認可能だ。

WEKDAでは、ユーザーの入力に応じて応答を作成する処理には幾つかのタイプがある。

(1)ユーザーの入力が質問でなかったとしても、その入力からユーザーの興味を引きそうな知識を問う質問を深層学習によって自動生成する。
(2)WISDOM Xから質問への回答として提供された複数の回答、回答が抽出されたオリジナルの文を深層学習によってランキングし、応答として適切な回答及び回答が抽出されたオリジナルの文を選択できる。
(3)(2)で選択した回答と回答が抽出されたオリジナルの文を使って応答を作成する。

NICTによると、ユーザーの入力に応じて質問を自動生成し、その回答に基づいて対話を行うシステムは前例がなく、この質問の自動生成によって、多様なトピックに対してユーザーの興味を引く可能性の高い知識を含む応答を合成することができると説明する。

NICTでは、このシステム開発の最終目的は、高齢者からビジネスパーソン、エンジニア、子供まで多様なユーザーに向けてWebから得られる多様な知識を何気ない雑談を介して提供し、高齢者のケアや教育、仕事上の気付きを与えることによるイノベーションの創発まで様々な価値を提供することを掲げている。