AI-OCRでのPDFからの文字読み取りについて
職場にて紙媒体で①職員コード、②漢字氏名、③カナ氏名...等をチェックする作業をしています。
これらのチェック作業をデータ上で行いたく、「紙をPDF化→OCRで各情報を読み取り→CSV等で保存」という処理ができないかと考えておりました。
最近AI-OCRというものの存在をしり、それにより上記のような作業ができるのだろうか...と思いました。
調べてみても公式サイトの情報はありますが、いまいち実際の使い方がつかめず、知っている人がいれば次のようなシナリオが作れそうか教えてくださると助かります。
条件1:PDF化されたデータを1ページ目から最終ページまで各ページごとに処理を行う。
条件2:各ページには職員コード、漢字氏名、カナ氏名等の情報の記載があり、それらを全て抽出する。
条件3:様式は基本的に統一されているが、若干のずれ(スキャン時のズレ等)や汚れ(鉛筆でのチェックマーク等)がある。
時期によっては上記の作業を数千枚目視で確認しております。
データにさえ落とし込めればチェック用のデータと一瞬で突合できるので非常に助かるのですが...。
この質問は解決済みのためクローズされています。
うぃん ベストアンサーとして選択しました
回答とコメントは、会員登録(無料)で閲覧できるようになります。
新規登録