世界最大級210万語超の日本語辞書を用いた自然言語解析が可能に

https://soundcloud.com/user-221451866/210a

NTTコミュニケーションズ(NTT Com)は、NTTグループの40年以上にわたる自然言語解析技術の研究成果を手軽に利用できるAPIサービス「Communication Engine "COTOHA API"」(以下、COTOHA API)の提供を開始した。


NTT Comは、2016年10月から日本語による対話が可能なAIエンジン「Communication Engine "COTOHA Virtual Assistant"」を提供している。同サービスは、NTTグループが40年以上にわたって蓄積・精錬した日本語辞書とAI関連技術「corevo(コレボ)」とNTT Comが独自開発した自然言語解析技術により、的確な日本語の理解による自然な対話を実現しているという。

今回、同サービスに実装されている高度な自然言語解析技術を、様々なサービスに手軽に組み込み、開発の迅速化や新サービスの創出に活用してもらえるようにCOTOHA APIの提供を開始する。

このサービスでは、日本語の様々な意味を理解できる基本語辞書と、企業名や業界用語に対応する専門用語辞書を合わせた210万語超の日本語辞書を活用してAPIを提供する。専門用語辞書は、企業や団体の固有名詞、経済や法令に関する用語、製造業や情報通信業など業界用語にも対応。収録語彙については、定期的なメンテナンスを行うことで有用性の維持向上を行う。

また、NTTグループ独自の高度な日本語構文解析技術と、単語を3,000種の意味属性に分類できる日本語語彙大系を基礎技術として活用しており、単語の意味を正確に捉え、文脈に応じて変化する言葉の意味も理解することが可能。さらに、個別辞書設定やAPIパラメーター設定によって精度の向上が図れる。