AI-OCRでのPDFからの文字読み取りについて [解決済]

解決済ビュー1517件2024年4月9日 18:18WinActor＃OCR

うぃん投稿2024年4月7日 1:11

職場にて紙媒体で①職員コード、②漢字氏名、③カナ氏名...等をチェックする作業をしています。

これらのチェック作業をデータ上で行いたく、「紙をPDF化→OCRで各情報を読み取り→CSV等で保存」という処理ができないかと考えておりました。

最近AI-OCRというものの存在をしり、それにより上記のような作業ができるのだろうか...と思いました。

調べてみても公式サイトの情報はありますが、いまいち実際の使い方がつかめず、知っている人がいれば次のようなシナリオが作れそうか教えてくださると助かります。

条件１：PDF化されたデータを１ページ目から最終ページまで各ページごとに処理を行う。

条件２：各ページには職員コード、漢字氏名、カナ氏名等の情報の記載があり、それらを全て抽出する。

条件３：様式は基本的に統一されているが、若干のずれ（スキャン時のズレ等）や汚れ（鉛筆でのチェックマーク等）がある。

時期によっては上記の作業を数千枚目視で確認しております。

データにさえ落とし込めればチェック用のデータと一瞬で突合できるので非常に助かるのですが...。

この質問は解決済みのためクローズされています。

うぃんベストアンサーとして選択しました 2024年4月9日 18:18

回答とコメントは、会員登録(無料)で閲覧できるようになります。