0

お問い合わせ分類:OCR

( 導入環境:  )

( バージョン情報:  )

( ご利用中の資材:  )

※長文失礼いたします。

【概要】
現在、我々は、不特定多数の企業が受領した様々なフォーマットの請求書の「企業名」「請求金額」「請求日」を読み取って、手入力の手間なく登録できるように、DXSuiteのDeveloper's APIの「読取ユニット登録」等のAPIおよび非定型の請求書帳票定義を活用しています。
しかし、受領請求書以外にも、様々な取引関係書類もOCRで読み取れるようにしたいというユーザーニーズがあるため、低い読取コスト・ある程度の読取精度・小さい開発コストでこれらのファイルも読取できるようにしたいと考えておりますが、DXSuiteとしてのベストプラクティスや良い案があればご教授いただけないでしょうか。
詳細な要件は以下の通りです。要件②が重要ポイントかつ妥協しがたいポイントです。

【要件】
①読取したい書類
 ・受領または発行した、注文書・見積書・請求書・領収書・納品書の5種類

 ・不特定多数の企業の書類のため、書類の形式(フォーマット)はさまざま。
 ※可能であれば全種類読み取れると良いが、難しければ一部の書類でも良い。

②DXSuiteへAPIでファイルをアップロードする際、そのファイルがどの書類種別か分からない。

 ※こちらのシステムでは、ユーザーからの様々なファイルを受け付けた後、DXSuiteへ読取処理を行った後に、ユーザーがその書類をどの書類種別として登録したいか選択するUIをとっています。
③読取したい項目
 (i)取引先の企業名
 ※理想は、発行書類の場合は発行先の企業名、受領書類の場合は発行元の企業名を個別で読み取りたいが、DXSuiteとして、アップロードされた書類がその企業が発行したか受領したか判別が難しい想定のため、発行元・発行先共に読み取るでも良い
 (ii)取引金額
 (iii)取引日

 (iiii)書類種別 ※任意
④低い読取コスト
 非定型帳票定義は現在、領収書・注文書・納品書がサポートされている認識ですが、要件②のため、全ての帳票定義で読取処理を依頼する必要が出てきてしまうため、読取コストが帳票定義の数に比例して大きくなってしまう懸念はあるので、できるだけ避けたいですが、この方法でしか無ければ致し方ないと考えております。

【その他ご質問・ご確認】

(A)DXSuiteを使って、指定したファイルが、注文書・見積書・請求書・領収書・納品書のいずれに近しいかを判断する方法は何等かありますでしょうか。

(B)非定型の請求書の帳票定義であっても、注文書・見積書・領収書・納品書に対してもある程度の読取精度が確認できているなどの検証結果がもしあれば、ご提示可能な範囲でもご連携いただけますと幸いです。保証いただくつもりはございませんので、参考程度の情報の認識です。特に見積書は非定型帳票定義にないため、他の何等かの帳票定義で読取精度がある程度出るかどうかを把握したいです。

(C)最近新たに追加された「項目抽出」は現状APIが公開されていない認識ですが、今後公開の予定や検討はございますでしょうか。
また、この「項目抽出」機能は、API経由でなければ、要件①~④をある程度クリアしうるソリューションの認識で合いますでしょうか。

技術支援チーム66 回答した質問
回答とコメントは、会員登録(無料)で閲覧できるようになります。