人工知能OCRでデータ入力など業務を自動化、ロボットとの連携も

もとはAI(人工知能)の研究分野であったという。OCR(光学文字認識)は字形を読み取り学習して識字率を向上させる。技術はその実用段階において、活字を文字コードへ変換するシステムの基盤となった。

口座開設の申請書をはじめ、さまざまな行政書類でも手書きすることの多いこの国で、馴染みの深い"文字認識"といえば、ハガキや封書のそれだろう。昭和47年には国産初のOCR機が完成していた(郵政博物館ウェブより)。郵便番号は手書きするにしてもその数はたった10種類。

日本語の50音×2種に加えて、英文字大小計52種類、常用漢字だけでも2,136種類もあり、それらが組み合わさった手書き文字列をOCRで読み取りデジタルデータ化することは至難の業である。勢い、各種申請書を扱う企業・団体では、"人力"データエントリーサービスを利用したり、自らそのような部署を設けたりする必要がある。

今日、インテックアグレックスは、AIを用いたOCRを共同開発したと発表。帳票や申込書等に記入された住所や名前を自動認識するという。両社のOCRは、インテックが先進的に取り組み大学や研究機関と共同研究を重ねてきた画像処理技術に、ディープラーニングをはじめとする機械学習技術――その教師データにアグレックスが50年以上蓄積してきたデータ入力の経験・ノウハウを取り入れたことで、高い識字精度を実現している。

従来困難だった手書きカタカナ文字、クセ字や走り書き文字なども認識可能にした。同OCRを事業に活かすことで、業務効率化や労働人口減少への対策、働き方改革の推進、品質向上といった効果が期待できるという。

AI OCRについて、インテックはRPA(ソフトウェアロボット)を連携した事業を予定。アグレックスは自社商品のCRMマスタファイルとの連携によるデータ読み取り精度の更なる向上と、データエントリーなど向けソリューション展開を目指すという。