TOPAI-OCRとは

AI-OCRとは

紙や画像中の文字を認識し、テキストデータに変換する技術を「OCR(Optical Character Recognition:光学的文字認識)」と呼びます。

OCRそのものは決して目新しい技術ではありませんが、従来のOCRは書類に1文字枠が記載された専用帳票が必要などの制約が多かったことから、幅広い用途で使われるまでには至りませんでした。

このような状況を変えたのが、AI技術を採り入れたOCRである「AI-OCR」です。AI-OCRはAI技術の1つであるディープラーニングを利用し、手書き文字を含む多くの文字をあらかじめ学習しておきます。その学習結果を用いて、画像の中にある文字を認識することにより、過去のOCRと比較して圧倒的に高い認識精度を実現しています。

従来のOCRとAI-OCRを比較したとき、大きな差が生まれるのは手書き文字の認識率です。パソコンで印刷した書類の文字や書籍などの活字であれば、従来のOCRでもそれなりの精度で認識することができました。しかし手書き文字では認識率が大幅に低下することも少なくありませんでした。

しかしAI-OCRでは、膨大な量の手書文字を収集してディープラーニングで学習させたことにより、手書き文字でも高い認識精度を実現しています。

文字と文字の間隔にばらつきが生じる、フリーピッチで書かれた文字も高精度で認識可能であることもAI-OCRの大きなメリットです。従来型OCRでは文字と文字のつなぎ目や切れ目を判別することが困難であり、たとえば「旧」という漢字1文字をアラビア数字の「1」と漢字の「日」に分けて認識してしまうといったことがありました。このような認識ミスを防ぐため、あらかじめ用意した文字枠の中に文字を書くことで、手書き文字の認識精度を高めるといった工夫が行われていたのです。

しかしAI-OCRであれば、適切に1文字ずつ認識することが可能であり、たとえば大きな1つの枠の中に自由に文字を記述するようなケースでも、高い精度で文字を認識することが可能になっています。

また、漢字とカタカナやひらがな、数字、アルファベットが混在している、あるいは名前に判子の陰影が重なっているような内容でも、AI-OCRであれば高精度に認識することが可能です。

すでにAI-OCRは幅広い領域で使われ始めています。具体的な活用例としては、申請書や申込書といった帳票に手書きされた内容をAI-OCRでテキスト化してシステムに入力するといった作業が挙げられます。

AI-OCRを使わない場合、帳票に書かれた内容を目で見ながらキーボードでパンチ入力することになります。これでは帳票の数が膨大になると、多くの人手を割くことになり、効率的とはとても言えません。

しかしAI-OCRを利用すれば、帳票に書かれた手書き文字が自動的にテキストデータに変換されるため、人手を割く必要はありません。また人が作業するよりも圧倒的に高速に処理できることも大きなポイントです。

従来型OCRと異なり、AI-OCRは手書き文字の認識精度も高いため、帳票に書かれた内容と出力されたテキストデータを照合し修正する作業においても、負担の軽減が図れます。

AI-OCRとRPAを組み合わせる事例も数多く現れています。前述した、帳票に書かれた手書き文字の内容をシステムに入力するといったとき、RPAを利用すればAI-OCRが認識した文字の内容を自動的にシステムに入力する、といったことが可能になるためです。こうしたことが実現できれば、さらなる業務効率の向上が果たせるでしょう。

NTTデータでは、このAI-OCRソリューションとして「NaNaTsu AI-OCR with DX Suite」や、「AI inside Cube」、「DX Suite」等を提供しています。

「DX Suite」は手書き文字でも高精度でテキストデータ化できるのはもちろん、乱筆文字であっても高い精度で認識することが可能です。さらに使えば使うほど認識精度が高まる学習機能を備えていることも特長です。

また利用料型の「DX Suite」であれば低コストでの導入が可能なうえ、50年のOCR提供実績を誇るNTTデータならではの無料読み取り精度診断もキャンペーン提供しています。

NTTデータがRPAソリューションとして提供している、「WinActor」との連携ももちろん可能です。「DX Suite」と「WinActor」を組み合わせることにより、たとえば送られてきた請求書をPDFに変換し、「DX Suite」でテキストデータ化した上で業務システムに入力するといった一連の業務をワンストップで自動化することが可能になります。

働き方改革の推進、あるいは人材の採用難に対応していくためには、さらなる業務の効率化が欠かせません。それを実現する上で、業務の大幅な効率化を果たすことができる「DX Suite」と「WinActor」は力強い味方となるでしょう。

関連記事

2018年9月27日(木) AI inside社と業務提携し、RPAとOCRによる一元的な事務効率化を実現
https://www.nttdata.com/jp/ja/news/release/2018/092701/

町田市、郡山市、市川市、つくば市、横浜市、福岡市におけるAI-OCR実用性の検証結果について
https://www.nttdata.com/jp/ja/news/services_info/2019/032700/