ホーム > 会社情報 > STIC×DREAM > Vol.01 > Tech & Quality Report

顧客の声をビジネスに生かすテキストマイニング技術

  • Tech & Quality Report
  • キヤノンITソリューションズが、これまで数多くのシステム開発によって培ってきた経験と品質向上への取り組みにより、お客さまの業務課題を解決した好事例や研究の成果をご紹介します。

顧客視点で製品やサービスを展開するためには、コンタクトセンターへの問い合わせやSNSの投稿により顧客が実際に語った期待、要求、不満などの「顧客の声」を活用することが重要である。顧客の声はテキストデータとして保存されていることが多く、テキストマイニングと呼ばれる技術を用いて分析を行うことで、そこから有用な知見を発見できる。本稿では、テキストデータおよびテキストマイニング技術の概要を説明し、筆者らが開発しているテキストマイニングツールを紹介する。

テキストデータとテキストマイニング

テキストデータには、売上のような数値データだけでは分からない顧客の生の意見が含まれている。例えば「なぜ買ってくれるのか?」という購入理由もテキストから見つけることができる。企業活動においては、マーケティング、製品の問題発見、FAQ作成などにテキストデータを活用することができる。

利用できるテキストデータとして、企業内では日報・報告書などの文書や、アンケートの自由記述、メール、コンタクトセンターの対応履歴などがある。また、幅広い消費者からの声として、SNSやブログなどネット上のデータも利用できる。

有用な情報が含まれる一方で、大量のテキストデータの活用は簡単ではない。例えばコンタクトセンターへの問い合わせ履歴が数百万件たまっている場合、分析者が1件ずつ読んで分析することはほぼ不可能である。Excelで分析しようとしても、未加工のテキストデータは集計ができない。そこで、テキストマイニングの技術を用いて分析を行うことが有効である。テキストマイニングは、大量のテキストデータに対して興味深い情報の探索や傾向の分析を行う技術である。

VOC分析ツール

筆者らは「VOC分析ツール」という名前のテキストマイニングツールを開発している。「VOC」は「Voice Of Customer」、すなわち顧客の声の略称である。

VOC分析ツールはウェブアプリとしてブラウザ上からアクセスでき、複数人が同じデータの分析を行うことができる。稼働環境はオンプレミスでもクラウドでも容易に対応可能である。データとしてはテキストに限らず、数値データ・時刻データ・カテゴリーデータなどを組み合わせても分析できる。データの集計・検索にはOSSの高速な検索エンジンであるElasticsearchを利用し、日本語処理は独自の実装を行っている。

VOC分析ツールの主な機能を以下で紹介する。

(1)話題俯瞰(ふかん)

テキストデータの分析にあたり、全体として何の話題が多いか把握することは重要である。VOC分析ツールでは、頻出する単語と単語間の係り受け関係をネットワーク図で提示することで、分析者が話題の全体傾向を俯瞰できるようにしている(図1)。

話題俯瞰のネットワーク図

話題俯瞰のネットワーク図(図1)

画像を拡大する

(2)深掘り分析

テキストマイニングは「気付き」を得る技術だといわれている。分析者が望む観点に基づいてデータを深掘りし、興味深い内容を含む元テキストを確認することが気付きを得るには重要である。

VOC分析ツールでは、画面に表示された時系列グラフ、単語一覧表などをクリックすることで、テキストを絞り込んで深掘り分析が実行できる。例えば「作成月が2017年10月のテキストのみ」、「『欲しい』という単語を含むテキストのみ」といった絞り込み条件を設定し、その絞り込み条件に合致したテキストの集計を行う。VOC分析ツールの特徴として、ほぼクリック操作だけでAND・OR・否定などの多様な絞り込み条件の指定が可能な点が挙げられる。

分析者は、画面上に興味深い情報を見つける→そこをクリックしてテキストを絞り込む→元テキストを確認して知見を得る、という試行錯誤的な分析を繰り返し行い、気付きを得ることができる(図2)。

深掘り分析

深掘り分析(図2)

画像を拡大する

(3)テキストのカテゴリー分類

VOC分析ツールでは、カテゴリーごとの単語辞書を用いてテキストの階層型カテゴリー分類を行うことができる。辞書の編集はユーザーが自由に行うことができ、辞書を編集すると分類結果がどう変わるかシミュレーションすることもできる。

(4)ポジネガ分析

「製品Aは映像がきれいだ」といった顧客の声は、製品の顧客からの評価を知るための重要な手掛かりになる。ポジネガ分析の機能では、好意的(ポジティブ)な評価と否定的(ネガティブ)な評価をしている単語をテキストから抽出し、ワードクラウドと呼ばれる可視化方法で表示する。

(5)分析画面の共有・再現

VOC分析ツールの分析画面は他の分析者と容易に共有ができる。例えば、「『欲しい』という単語を含むテキスト」という絞り込み条件で深掘り分析を行い、興味深い知見を見つけたとする。その絞り込み条件を保存して他の分析者と共有すれば、他の分析者も同じ分析画面を再現できる。

VOC分析ツールの日本語処理

テキストデータは非構造化データと呼ばれ、売上のような数値データや製品型番のようなカテゴリーデータと異なり、多様な情報が混ざり合って構成されている。そのため、テキストデータを扱うには特有の日本語処理が必要となる。

VOC分析ツールで用いている日本語処理の技術・ノウハウの一部を説明する。

(1)形態素解析

話題俯瞰・深掘り分析を行うためには、テキスト中に含まれる単語を抽出する必要がある。形態素解析の処理により、テキストを単語で区切ることができる。単語区切りの例を以下に示す。

音声は聞こえたが映像は映らない
音声 / は / 聞こえた / が / 映像 / は / 映らない

形態素解析により得られた単語を抽出することで、このテキストが「音声」や「映像」などの単語を含んでいることが分かる。

VOC分析ツールでは、OSSの形態素解析器と独自処理を組み合わせて単語抽出を行っている。

(2)係り受け解析

話題俯瞰機能では、テキスト中での単語同士の関係(係り受け関係)を表現している。そのためには係り受け解析という処理が必要となる。上記のテキストの例では

音声 - 聞こえた
映像 - 映らない

という係り受け関係の組を抽出することができる。

係り受け解析により、単語の抽出だけでは分からない、「何がどうした」などのもう一段深い話題の抽出を行うことができる。

(3)辞書の管理・作成

VOC分析ツールでは、カテゴリー分類はユーザー作成のカテゴリー辞書で行い、ポジネガ分析は専用のポジネガ辞書を用いて行っている。カテゴリー辞書は、「『音量』という単語を含むテキストは『音声出力機能』のカテゴリーに振り分ける」といった、単語とカテゴリーの関係を管理する。ポジネガ辞書は、「『きれい』という単語は好意的な意味である」といった、単語と好意的/否定的の極性の関係を管理する。このように、日本語処理を行う上では、単語と付加的な情報の関係を示す辞書の管理・作成に関するノウハウが重要となる。

活用における課題

テキストマイニングツールはすでに多くの企業で幅広く導入されている。一方で、テキストマイニングにより業務改善を目指しても、ツールを導入して使うだけでは効果が得られない場合がある。

データ分析を実務に活用するためには、データを処理して知見を得る以外にも重要なステップが存在するという主張がある。それは、データ分析によって解決できる業務課題を「見つける」、見つけた業務課題から適切な分析問題を設定して「解く」、業務担当者に分析結果を「使わせる」というステップである。その観点が不足している場合、実用性のない分析課題を設定する、複雑すぎる分析を行い現場の運用が大変になる、多忙な業務担当者が分析結果を使わないまま放置するなど、効果的な活用ができない可能性がある。

人工知能学会誌の解説1では、企業の現場におけるテキストマイニングを多数行ってきた著者による知見が示されている。同解説では、「何が面白く有益かは、データの内容や関連業務に精通していなければ判断できない。有意義な結果を得るためには、業務知識に基づいた分析の観点を定義することが重要である」と業務・データ内容についての知識に基づいた分析を行うことの重要性が強調されている。

効果的な活用のための工夫

進 義治

キヤノンITソリューションズ株式会社
R&D本部 言語処理技術部
進 義治
Yoshiharu Shin

これらの知見を基に、VOC分析ツールでは、効果的な活用のための仕組みを整えている。

まず、業務・データ内容についての知識に基づいた分析が重要であるという知見を踏まえ、業務ごとの個別の機能開発を容易な構造にしている。また、分析結果を現場で使っていただけるよう、他システムと連携が容易な構造にしている(図3)。

現在、社内での実際の業務を対象として取り組みを行っている。社内で開発している製品のサポート業務では、その業務ですでに効果を確認されている分析軸を扱うための機能をVOC分析ツールに追加している。デジタルマーケティングの業務では、SNS上のユーザーに直接アプローチすることを支援する機能を開発し、業務を効率化した。

VOC分析ツールの構成

VOC分析ツールの構成(図3)

画像を拡大する

当本部では、SNS、コールセンターの問い合わせ、メールなどさまざまなデータでテキストマイニングを行い、技術開発と課題解決支援を行ってきた。今後も顧客の声のさらなる活用を目指し、データと業務の特性に応じた柔軟な技術開発を行っていきたいと考えている。

【参考文献】

  • テキストマイニングの普及に向けて
    ―研究を実用化につなぐ課題への取組み―(那須川 哲哉、2009)
  • 会社を変える分析の力(河本 薫、2013)

※ 記事中のデータ、人物の所属・役職などは、記事掲載当時のものです。

ホーム > 会社情報 > STIC×DREAM > Vol.01 > Tech & Quality Report