類似文書検索エンジン DiscoveryBrain
キヤノンITソリューションズ独自の自然言語処理技術(NLP)を搭載した類似文書検索エンジン
「DiscoveryBrain」は企業内に点在する複数のストレージシステム、文書管理システムを横断して検索することが可能な、類似文書検索エンジンです。独自の自然言語処理(NLP)技術により、検索対象文書を分析し、個々の文書の特徴を的確に理解することで、検索ユーザーの探したい文書をすばやく提示することを可能にします。
単語や短文を検索条件とした検索だけではなく、複数ページにわたる文書を検索条件として使用する「類似文書検索」機能を備え、検索条件の文書と内容が類似した文書を見つけ出すことが可能です。
「DiscoveryBrain」はオンプレミス型の検索エンジンで、企業内に点在しているストレージ、文書管理サーバーを横断的に検索することが可能です。内蔵する分散型検索エンジン「Elasticsearch」により高速な全文検索と、さまざまな利用規模(検索データ量)に対応できる拡張性を備えています。
単語の完全一致検索やあいまい検索はもちろん、キヤノンITソリューションズ独自の自然言語処理技術を利用し「検索キーワードを含まないが内容の近い文書の検索」「手元の文書そのものを検索条件とする検索(類似文書検索)」が可能です。
更に、自然言語処理により文書内に特徴的に表れる単語情報の抽出(特徴語抽出)し、絞り込みのヒントとして活用したり、文書のカテゴリ分類(自動タグ付け)を行うことができます。
概要イメージ
- 社員の検索スキルにばらつきがあり、ナレッジの共有・情報格差の解消が進まないことが課題のお客様
- 文書格納場所が多岐にわたり、目的の情報にたどり着くのに時間がかかることが課題のお客様
- 大量にある文書の整理、分類に時間がかかり、情報資産として活用が進まないお客様
- 文書同士のマッチング検索(類似文書検索)検索キーワードを指定せずに、文書をそのままあるいは全文コピーして文書検索エンジンに渡すことで、類似する文書を検索することが可能です。
- 検索対象文書の自動分類業務上類似する単語をグループ化し、分類名を付与することができる辞書機能を備えています。この機能により、辞書で定めたルールに基づき、文書を自動的に分類することができます。また、検索時の単語やフレーズが含まれていない文書も、検索条件に類似している情報と判断し、検索結果に含めることができます。
- 横断検索文書を一箇所に集約する必要がなく、運用中の文書管理サーバーやクラウドストレージを横断的に検索することが可能です。
- API機能によるUIカスタマイズ顧客に合わせ検索画面をカスタマイズすることができます。またビジネスチャットサービスに文書検索用ボットを作成することも可能です(チャットボット連携)
基本検索
完全一致検索、あいまい検索(類義語検索)、検索結果から抽出した関連語による絞り込み検索、検索結果の優先順位づけ(スコアリング)など、企業内文書検索に必要とされる基本的な検索機能を備えています。
※実際の検索画面はお客様のご要望に応じて個別にSI開発にて作成いたします。
類似文書検索
検索条件として文書そのものを使うことができます。例えば、ヒアリングメモや提案依頼書をそのまま、あるいは全文コピーしてDiscoveryBrainにアップロードすることで、類似する文書を探し当てることができます。検索ユーザーが目的の文書を探し当てる為に、検索ワードを自分で考えるのに時間をかけたり、何度も検索し直すといった手間を削減します。
文書分類
お客様専用の辞書を作成することにより文書分類ルールを設定、業務上類似するキーワードをグループ化(タグ付け)することが可能です。この機能により、「検索キーワードを含まないが内容的に類似している文書」も検索結果に反映することができます。また、検索結果に文書分類結果を表示し、検索結果の絞り込みや検索ユーザーが思いつかなかった検索条件の提示といったことも可能にです。
横断検索(クローラー)
複数のストレージ、クラウドサービスを横断的に検索することが可能です。
Sharepoint Online、Salesforce(添付文書)、Box、ファイルサーバー(SMB)用のクローラーを標準機能として備えています。その他のシステム用のクローラーについてはお問い合わせください。
API機能
API機能を活用し、お客様のご要望に応じた検索画面を構築することが可能です。独自のWeb検索アプリケーションの開発、社内ポータルのエンジンとしてご活用いただけるほか、ビジネスチャットで稼働するボット開発も可能です。
ボット連携用のテンプレートについては、株式会社L is Bが提供するビジネスチャットサービス「direct」を用意しています。
ユースケース
人材育成に貢献するナレッジ検索基盤
蓄積された社内文書を有効活用する検索基盤を整備し、社員間の知識・スキル伝承を促進。将来的な生産性低下のリスクを払しょくするユースケースのご紹介です。
- 従来、対面のコミュニケーションを通して有識者から知見の共有が行われていたが、リモートワークの拡大により、この人材育成方式の継続が難しくなってきた。
- 豊富な知識を持つベテラン社員の減少がこの状況に拍車をかけており、将来的な生産性低下につながるリスクとなっている。
業務別活用例
設計・保守点検
新規設計を行う際、要件をインプットとして過去の設計図、マニュアル、部品交換履歴等の技術情報を取り出し参考とする。
対象文書:マニュアル、設計関連文書
研究開発
自分で考案したアイデアや研究内容に関連しそうな論文や過去の特許情報をすばやく検索する。
対象文書:論文、特許文書
営業
顧客から受け取った提案依頼文書などをそのまま過去の提案履歴と照合。受注した案件を参考に提案書を作成する。
対象文書:提案書、見積書
人材教育
手元の教材と似たものを検索し、過去の類似教材を集中的に学習する(教育側であれば新規問題・課題作成に活かす)。
対象文書:マニュアル、教科書
契約作成・審査
過去締結済みのリファレンス契約書を条文ごとインプットして検索し、契約書作成の一助とする。
対象文書:契約書
お客様の課題、検索対象、重要視する条件などを確認させていただき、検索に関わるユーザーインターフェースの構築、システム構成を含めたご提案をさせていただきます。お客様にご提案内容をご紹介いただいた後、開発、導入を進めさせていただきます。
DiscoveryBrainの持つ検索機能やクローラー、API機能を活用することで、従来のスクラッチ型開発に比べ、導入までの期間を短縮することが可能です。また、ご要望に応じて、導入前に実データを用いたPoCを行うことも可能です。導入に関するお問い合わせはWebフォームよりお気軽にお問い合わせください。