画像解析技術とAIの活用で社会課題解決に貢献
AI-OCRによる業務効率化のポイントR&D News+Reports 研究開発
公開日:2025年9月17日
キヤノンITソリューションズ株式会社
R&D本部 先進技術開発部
八尾 唯仁
画像解析技術とAIの活用で提供価値の可能性を広げる
先進技術開発部は、画像解析AIを中心とした技術開発をミッションとし、キヤノンらしさを訴求する製品/ソリューションの開発に取り組んでいます。具体的には、カメラやスキャナーから得た画像や映像データに対し、AIを活用して物体を検出したり文字を読み取るなど、画像や映像データを読み取る製品とITを結び合わせた新たな製品/ソリューションを開発するための研究をしています。
私はそのなかで、文字認識や帳票解析分野の研究開発に加え、AIを活用した画像解析技術を製品へ適用し、その製品の提供価値を高める活動に従事しています。これまでは既存製品を対象とした活動が中心でしたが、現在はより新しいビジネス創出に寄与する製品を生み出すため、新製品の企画段階から参画し、事業部門の活動に伴走することに注力しています。
「Trustworthy AI」で技術力と信頼性を両立する
AIを活用した画像解析技術を製品へ適用するには、数多くの試行錯誤を行う必要があります。例えば、実験環境では正常に動作していても、実際の使用環境ではノイズ(不要な情報)が入り込み、期待通りに機能しないケースです。この不具合を解消するには、AIがなぜその判断をしたのか、何を学習させることが必要なのかを紐解いていく必要がありますが、AI技術は、その内部で何が起きているか外部からは理解しづらいブラックボックスのような性質があるため容易ではありません。
そこで、先進技術開発部では、AI開発を効率化するためのプラットフォーム「LaiGHT(ライト)」を開発しました。このプラットフォームは、学習データや計算リソースの管理、AIチューニング時のパラメーター変更とその記録など、これまで個別に実施していた作業の一元化をサポートできます。さらに、AIの学習結果を見える化できるため、開発メンバー間での検討やお客さまへの進捗報告にも活用できます。このLaiGHTを基盤にして、キヤノンITソリューションズ(以下、キヤノンITS)は、カメラで農作物の生育状況を計測しながら適切な収穫時期の判断に役立つスマート農業システムの開発や、カメラ映像から煙を検出して火災の早期発見を支援し、防災対策に貢献するシステムの開発を行いました。
近年、AIの活用が身近になったことでAIに対する社会の目が変化しつつあり、技術力の高さだけではなく「そのAIを信頼できるか」という問題が世界的に注目されています。信頼できるAIとは、「Robustness (頑健性)」、「Explainability (説明可能性)」、「Fairness (公平性)」、「Privacy (プライバシー)」などの観点からの信頼であり、これらを保有しているAIを「Trustworthy AI(信頼されるAI)」と呼んでいます。そのため、私たちは、「Trustworthy AI」を実現する技術(特許出願中)を用いて開発を行い、技術力だけでなく信頼性も高めていく取り組みを進めています。
業務効率化につながる「AI-OCR」の活用法
社会課題やお客さまの経営課題の解決に貢献するため、営業担当者からの現場の声や、外部の専門家の知見、そして私たちが長年培ってきた画像解析技術を融合させて提供価値の高い製品/ソリューションを開発しています。
最近では、製品開発だけでなく、業務効率化に向けたAI技術の活用方法についても、お客さまから多くのご相談をいただいています。特に金融業界のお客さまからは、「AI-OCR」に関するお問い合わせが増加しています。
「AI-OCR」とは、PDFなどの文書から文字情報を読み取り、自動でテキストデータに変換する「OCR(光学文字認識)」技術にAIの最新技術を組み合わせたものです。この技術は、電子帳簿保存法(電帳法)改正により、2024年から電子取引データ保存が義務化されたことから、帳票管理システムで広く活用されています。改正後の電帳法では、紙の帳票の場合でも電子化して必要項目で検索できるよう管理する必要があります。ペーパーレス化することができれば、紙の帳票を電子化する手間を省略できますが、自社内もしくは自社とお客さま間でのさまざまな事情でペーパーレス化がかなわず、紙の帳票を使わざる得ないお客さまもいます。そこで、「AI-OCR」を活用すると、紙の帳票をテキストデータ化して保存可能になるため、業務効率化を図ることができます。
一見、どのような帳票でもテキストデータ化できるように思えますが、実は「AI-OCR」には認識が苦手なフォントやレイアウトなどがあり、帳票によっては正しく読み込めず、手入力をすることになり、かえって業務負荷が増えてしまうケースがあります。そのため、導入したものの活用方法に課題を抱えているお客さまが少なくありません。「AI-OCR」の技術的な解説は多く見受けられますが、活用のポイントまで触れているものが少ないと感じたため、キヤノンITSのコーポレートサイト内「テクニカルレポート」にて、「AI-OCR」の活用のポイントをご紹介する記事を執筆しました。帳票を「提出する側」か「受け取る側」かによって注意すべき点が異なるため、それぞれの立場に応じた解説をしています。また、AIの特徴を理解すると、「AI-OCR」の精度を高め、業務効率化を一層加速させることが可能です。「テクニカルレポート」では、技術者ならではの視点で実践しやすく、納得感のある方法をご紹介していますので、ぜひご覧ください。
キヤノンITSは、これからも技術力だけでなく、信頼性、そして製品への適用力も高めてまいりますので、画像解析にAIを組み合わせた技術の開発、そして活用方法についてもぜひご相談ください。
関連リンク
「AI-OCR」を使用した帳票の作成方法や読み取りのポイントについて、実際に研究・開発に携わる技術者の視点から解説します。