- コラム
連載コラム AI OCRソリューション CaptureBrain(キャプチャーブレイン)で業務効率化
第7回 OCR結果の確認・修正をするには? [2022.4.27]
皆さま、こんにちは。AI OCRソリューションCaptureBrain(キャプチャーブレイン)製品企画担当の山野です。だんだんと暖かくなり、春の訪れを感じる季節となりました。4月も後半になり、過ごしやすい季節となりました。GWも近づいてきておりますね。どのように過ごそうか、楽しみな今日この頃です。
さて前回までのコラムでAI OCRの実際の帳票読み取りイメージをご覧いただきました。第7回コラムでは、そんなAI OCRでも読み取れなかった結果についてどのように対応するのか?をご紹介できればと考えております。
前回のコラムはこちら
いかに高性能なAI OCRでも100%完璧な結果を得ることは難しく、OCR処理の最終工程で担当者による目視確認を行うケースが一般的です。CaptureBrainではこのようなOCR結果確認と修正をなるべくスムーズにできるような機能をご用意しております。
前回のFAX注文書の誤認識部分の修正
前回のコラムでご紹介したサンプルのFAX注文書は、うまく読み取れなかった箇所が明細行6行目にありました。
以下の画像のように、明細6行目の商品名について、AIより目視確認を推奨するアラートが表示されており、「ビートグラニュ糖30kg北海道産」を「ビートグラニュ糖30Kg北海道屋」と読み取ってしまっています。
このようなOCRの誤認識についてはCaptureBrainの画面で修正することが可能です。
以下の画像のように画面の左側に帳票画像の全体が、右上に拡大画像、右下に修正内容を入力できるフォームが配置され、実際の帳票画像と読み取り結果を見比べながら修正作業を行うことが可能です。
特に確認が必要な読み取り文字については、文字単位で赤のアラートが表示され、確認修正を行う担当者が注視すべき文字が、わかりやすく確認できるようになっています
CaptureBrain確認・修正画面
確認修正作業を補助するCaptureBrainの機能について
これらの方法を少し詳しくご紹介します。
- データの種別や入力される可能性がある文字の種類を限定する方法
- ユーザーで設定できる用語辞書を登録して修正に活用する方法
もしこのような確認・修正作業が頻繁に発生してしまう読み取り項目がある場合、CaptureBrainでは主に2つの方法で改善対応します。
データの種別や入力される可能性がある文字の種類を限定する方法
あらかじめ入力される記載内容がわかっている場合、帳票画像の読み取り項目を設定する際に「データの種別」を選択することで読み取り精度の向上を図ります。OCRエンジンに対して読み取り時のヒントを与えてあげるようなイメージとお考え下さい。
下の画像の例は、電話番号の記載を読み取りたい場合の例です。読み取り項目設定時に「データの種類」に「電話番号」を設定することで、電話番号読み取りに特化させることができます。CaptureBrainでは「電話番号」の他に「氏名」「住所」「金額」「活字のみ」などに限定することが可能です。
帳票画像の電話番号記入欄に対して「データ種別」で「電話番号」を設定している例
また、電話番号のようにパターンが決まっている項目以外の場合は、下図(読み取り項目設定の拡大図)のように記載内容の「文字の種類」を限定する方法もあります。こちらは「ひらがな」「カタカナ」「漢字」「アルファベット」「記号」など、どのような文字の種類が入るのかを指定して精度向上のための細かい調整を行うことができます。
「あ」「ア」「漢」などのボタンのON/OFFで「文字の種類」を設定している例
ユーザーで設定できる用語辞書を登録して修正に活用する方法
もう一つの方法は、辞書補正の機能を使用する方法です。
これは、OCR読み取り結果と類似の単語が辞書に存在していれば、その単語に読み取り結果を自動的に入れかえることができる機能です。
辞書を使用した補正のイメージ
例えば自社で保有している商品マスタを辞書に登録することで、OCRエンジンが多少異なった読み取り結果となった場合でも、商品マスタどおりの商品名に置き換えることが可能です。
辞書補正が設定されている箇所は、確認修正画面で補正のリストをプルダウンメニューから選択可能なため、仮に間違った記載であっても、簡単に修正することができます。
辞書設定の読み取り効果
それでは冒頭にご紹介した商品名をご認識してしまったFAX注文書について、辞書を設定して読み取り直してみましょう。辞書は用語を順番に記載したCSVファイルをご用意いただき、CaptureBrainの辞書設定画面でインポートいただくことで登録可能です。
商品名一覧のCSVファイルを「定型注文書_商品名」という辞書名でインポートした結果
次に、読み取り箇所でこの辞書を使った補正を行うように設定を変更します。
該当の読み取り項目に辞書「定型注文書_商品名」による補正をするように設定しました。
辞書補正機能を使用した読み取り結果
それでは、辞書補正を使用したFAX注文書の読み取り結果を見てみましょう!
辞書補正機能を使用した確認・修正画面
辞書補正機能で、商品名が画像と同じ読み取り結果になっていることが確認できました。
この明細行は正しく読みとれましたが、仮に、間違った辞書の単語が選択されていた場合、プルダウンメニューで正しい商品名に修正することができます。
プルダウンメニューで他の候補を確認
以上、AI OCRでも読み取れなかった結果をCaptureBrainではどのように対応するのか?確認・修正画面、辞書補正機能のご紹介を通じてご紹介させていただきました。
実際にCaptureBrainをご利用の際は、弊社にご相談いただければ、このような帳票読み取りの設定をサポートさせていただきますので、使いこなせるか不安な方もご安心ください。
CaptureBrainには無料トライアルがありますので、自社帳票の読み取り結果を正式ご契約前にご評価いただけます。無料トライアル中もサポート可能ですので、お気軽にお申し込みください。
AI OCRソリューションCaptureBrain無料お試しキャンペーン実施中!
CaptureBrain無料トライアルでは、本サービスを30日間無料でご利用していただくことができます。ぜひこの機会にお試し利用を体験してみてください。詳細はこちらのページへお越しくださいませ。
第6回コラムをお読みいただき誠にありがとうございました。
また、どうぞよろしくお願いいたします。
製品詳細情報はこちら:AI OCRソリューションCaptureBrain
関連するソリューション・製品
- コンテンツソリューション
コンテンツライフサイクルの各プロセスにおける課題を解決するために、オンプレミス・クラウド・モバイルなどのプラットフォームを問わず、お客さまに最適なソリューションをご提案します。
また、コンテンツソリューションに関する個別開発やカスタマイズの要望にもお応えします。
- CaptureBrain
CaptureBrainは手書き書類のデジタル化を支援するクラウド型AI OCRソリューションです。
キヤノンITソリューションズ独自のAI技術と画像処理技術で、高いOCR読取精度を実現。 これまで手作業により実施されていた入力作業の効率化に貢献いたします。