文字認識サービスとRPAの連携で働き方改革を強力にサポート

東芝デジタルソリューションズは、読み取り位置を事前に設定しなくても、受発注伝票や見積書など様々な書式・レイアウトの非定型文書から、必要な項目を探し出して読み取る文字認識サービスを商品化して提供を開始した。

近年、OCR(光学的文字認識)は、認識精度の向上など技術的な進化と、RPA(ソフトウェアロボット)との組み合せによる業務効率化への期待の両面から注目されている。しかし従来のOCRは、専用帳票を作成し、読み取り位置などの詳細定義が必要だった。そのため、実際に業務で扱われる紙文書の多くをOCR帳票化することは運用面から難しい。特に、様々な取引先から届く請求書のように書式のバリエーションが多岐にわたる場合、全ての書式を定義することは困難だった。

今回商品化した文字認識サービスは、専用のスキャナは不要で、オフィスの複合機などで作成した紙文書のイメージデータから、簡単な操作で必要な文字を認識するサービス。面倒な読み取り位置の詳細定義は不要で、キーワード(読み取りたい項目)を登録するだけで該当する項目を探して活字を読み取るので、さまざまな書式の非定型文書で利用可能。

特に請求書については、合計金額や請求番号などの主なキーワードを事前登録(プリセット)してあるのですぐに利用でき、合計金額・総合計・御合計などの言葉の「ゆらぎ」にも対応している。もちろん定型文書にも対応しており、読み取り位置をマウス操作で簡単に設定でき、活字だけでなく手書きも読み取る。

さらに、複数の文書をまとめて処理する一括読み取りや、読取後のチェック・訂正の利便性も強化。利用形態もクラウドサービス、オンプレミス、APIを選択可能。