AI活用による音声自動テキスト化、クラウドサービスで始まる

政府主導の「働き方改革」がさまざまに取り沙汰される。日本は世界でもまれにみる「会議大国」で、企業・団体では組織内の会議が頻繁に行われている。ゆえに議事録は無数に作成され、その能力は講演会や新製品やサービスの発表会でも発揮されれば良いのだが――。


人力での議事録作成は疲れてしまう。それが回覧されたり、保存されたりすることを思えば、迅速かつ正確に仕上げる必要があり、心理的にも負担が大きい作業になる。「『働き方改革』が聞いて呆れる」とつぶやきたくなる。今月4日、NTT出版は、音声認識製品を活用した「クラウド型音声自動テキスト化サービス」のβ版の提供を開始した。

NTTグループのAI技術「corevo®」のひとつ、NTT研究所の最先端音声認識技術を活用し、音声データのディープラーニング(深層学習)によって高精度のテキスト化を実現。そしてそのテキストをクラウド上で自在に編集・共有できるようにした。同サービスは、NTTテクノクロスの音声認識製品を用いて、大量かつ多種多様の表現および場面データをモデル化し、日本語の自動音声認識として比類なき正確性を達成している。

そのうえ、話す人の発音、騒音など周辺環境により自動認識結果が曖昧な箇所について、当該部分の音声を確認しながら編集する機能も備えていて、より完成度の高い文字起こしを可能にしている。従来、重要な社内会議、講演、プレゼンテーション等の議事録作成に多くの稼動を要していたところで、高い正確性で短時間に加工・流通しやすいテキストが自動作成される今回の新サービスは、業務改善および働き方改革に貢献するという。

NTT出版は、β版の協力企業内でのテスト利用を進め、ユーザインターフェースの検証とさらなる音声認識技術の向上、機能拡充を図り、より広く多くの顧客でコミュニケーションを活性化し、情報共有を加速するAI系クラウドサービスを展開していく構えだ。