OCR読取について
お問い合わせ分類:OCR
( 導入環境:Windows10(64bit) )
( バージョン情報:1.110 )
( ご利用中の資材: )
OCRにについて下記ご確認をお願いいたします。
添付資料は本質問投降後添付させていただきます。
1.読取誤認識
「7」を「2」と認識してしまっているがなぜなのか理由を教えていただけますでしょうか。
・読取対象範囲を狭めても同事象になっています。そのため、外側の枠線を読んでいることはありません。
・こちらの見解としては7の右上の部分が丸みを帯びているため、「2」と読み取っている見解です。
└9だと、丸みを帯びている部分が繋がっているため9と判断
└3だと、丸みを帯びている部分が2つあるから3と判断
→数字(もしくは文字)を読み取る際の判断基準(文字のどこの箇所を読み取って、結果を出力しているか)、
根拠等、今回の事象踏まえてお客様に説明できるようなご回答をいただけますでしょうか。
2.チェックボックス誤認識
入居年月の「S」にチェックが入っていないが、チェック有と判断される理由を教えていただけますでしょうか。
・こちらの見解では、帳票定義で設定している「S]と読み込む「S」に差異があり、違う文字として認識していることが原因だと考えています。
「S」の文字が薄くドット形式になっているため、どこかしらをチェックと誤認識している
3.チェックボックス読取設定
現状、チェックボックスの読取設定は上下左右枠ギリギリで設定しています。
そうすると、少しでもチェックが他の読取枠箇所にかかっているとチェック有と読み取ります。
その対策として、横幅は変更せずに縦幅を文字と同じ幅に調整してなるべく正読率を向上させようと考えています。
その際、正読率が逆に下がることはあり得ますでしょうか。またその理由を教えていただけますでしょうか。
また、この対策の判断は正しいでしょうか。
※縦幅を小さくすることで、他の箇所にかかっているチェック、汚れやごみを拾いにくくなることが想定されるため設定幅を変更させようとしています。
※縦幅を小さくしすぎると、丸で囲うチェックの場合、丸の上下が見切れてチェックとして判断できないことは懸念点としてあります。
※縦幅を文字の縦幅と合わせる理由として、定義として設定している文字と読み込む文字が異なると認識した場合、
OCRの仕様上チェック有無の判定がどうなるか分からないため、文字が全て枠内に含まれている状態で縦幅と合わせるよう考えています。
4.読取対象範囲について
読取対象範囲を囲うとき、外側の枠が紫の濃い線、枠中が薄い紫になっていますが、読取対象となるのは外側の枠が紫の濃い線を含むのか、薄い紫の箇所のみなのかどちらでしょうか。