AIによる音声認識の精度向上や自然言語解析の高度化を可能にするAPIを提供、NTT Com

NTTコミュニケーションズ(NTT Com)は、NTTグループの40年以上にわたる自然言語解析技術の研究成果を手軽に利用できるAPIサービス「Communication Engine "COTOHAR API"」(COTOHA API)において、新たに「言い淀み除去」「音声認識誤り検知」「感情分析」の3つのAPIを提供する。また、従来β版だった「照応解析」APIの正式版提供を開始する。


COTOHA APIとは、NTT Comが2018年9月より提供している、AIによる自然言語解析API。NTTグループが40年以上にわたって蓄積・精錬した210万語を超える日本語辞書、AI関連技術「corevo(コレボ)」と、NTT Comが独自開発した自然言語解析技術を実装している。


言い淀み除去機能(β版)は、音声認識処理後のテキストデータの中から、「ええと」や「あのう」といった言い淀みを特定し、除去する。既存の音声認識エンジンやアプリケーションにアドオンして活用することで、音声認識結果の精度向上が図れる。

音声認識誤り検知機能(β版)は、音声認識処理後のテキストデータの中から、認識ミスの恐れがある単語を検知・抽出するというもの。「認識した文章全体における誤り度合い」と「言い間違いや音声認識間違いの可能性が高い単語」をスコア化して表示する。このAPIを活用することで、音声認識結果の信頼度判定を行うことや、AIが人に対して聞き返しを行う際に不明点のみを尋ねることが可能になるという。また、今後提供予定の「音声認識誤り訂正」APIと組み合わせることで、誤りを自動で訂正して認識精度の向上が図れると説明する。

照応解析 (正式版)は、「あれ」「彼/彼女」「同〇〇」「その〇〇」など様々な指示語を検知し、それらが指し示す対象を特定する。構文解析と組み合わせて利用することで、解析精度を向上させることが可能だという。従来β版を提供してきたが、今回の正式版にて指示語が複数形の場合や、指示語の指す対象が複数の単語から成る場合などの様々な照応関係について認識できるようになった。

検証用として利用できる「for Developers」(無料)と、商用で利用する「for Enterprise」の2つのメニューを用意。for Enterpriseは初期費用がかからず、月額費用が基本料金13万円(税別)とAPIコール数に応じた従量課金で利用できる。