ビッグデータから“知識”を取り出す技術「データマイニング」「テキストマイニング」とは?

IT技術の発展に伴い、マーケティングを取り巻く世界は劇的に変化しました。

「データありき」でマーケティングを考えるのはもはや当然のこととなり、マーケティングにおけるデータ分析の重要性はますます高まってきています。また、ソーシャルメディアの発達に伴い、SNS上の顧客の声に耳を傾けることも重視されるようになってきました。

そんななか、マーケティング分野での活用が進んでいるのが「データマイニング」や「テキストマイニング」です。ビッグデータ市場の拡大が加速するにつれ、高速・高精度な分析技術が手軽に利用できるようになってきました。今回は、これらの基礎知識をご紹介します。

データマイニングとは

データマイニングとは、大量のデータを人工知能や統計学などの技術を用いて解析し、そこに潜むパターンやルールなどを採掘(マイニング)する技術です。

データマイニング自体は決して目新しいキーワードではありませんが、ビッグデータ処理やAIなどの技術の進化を受け、ここ数年改めて注目を浴びつつあります。モバイルデバイスやIoTの普及で日々増加し続けるビッグデータから、さまざまな知識や仮説を可及的速やかに取り出す必要性が高まっているのです。

●旧来より人工知能が取り入れられているデータマイニング●

データマイニングの方法としては、重回帰分析や主成分分析といった統計学的なアプローチがよく知られていますが、ニューラルネットワークという脳機能にみられる特性を生かした計算シミュレーション方法も古くから使われています。今でいうディープラーニングです。また、データマイニングを実行する上で、分析官があらかじめ仮説を組み立てながら解析する手順がオーソドックスですが、仮説を準備しなくてもよい「機械学習」を採用したデータマイニングもあります。いずれのデータマイニングもますます高速に、さらに自動化できるようになっています。ほんの数年前は高額で企業のマーケティング活動には利用しにくかったデータマイニングシステムも、クラウド化が進み手頃に利用できるものが増えました。WebサイトやECでは何よりも即時性が求められるため、データマイニングのエンジンがあらかじめ組み込まれたレコメンドシステムなどもあります。

データマイニングは表面には現れないつながりや法則などを即時に発見できる技術へ進化しており、すでに身近なところで自動的に使われている技術となっているのです。

データマイニングと顧客関係性管理

通販会社やクレジットカード会社をはじめとする、膨大な数の会員を持つ企業の多くがデータマイニングを生かしたダイレクトマーケティング施策を実施しています。

例えば通販会社では、性別、年齢などの顧客の属性と購入履歴を分析することで、「誰に対して、どの商品を、どのようにアプローチすれば売れるのか」といった傾向を割り出し、これを販売計画の策定に活用してきました。最近はスマホのような携帯端末の普及によって、「思いついた瞬間にモノを買う」ことが可能となってきているので、分析の軸に「いつ」という要素が加わりました。O2Oへの取り組みが進み、複数のチャネルをまたいでの分析に注力する企業も増えてきています。

また、クレジットカード会社では、顧客の属性情報とカードの利用履歴をもとに分析を行い、その結果をキャンペーンへの反応率向上などに役立てています。クレジットカード会社には年齢や性別といった一般的な属性情報に加えて、きめ細やかな購入履歴データがあり、多様な観点から分析を行っています。

予測モデルを作成

データ分析時のアプローチにはいくつかの手法がありますが、例えば、 通販カタログを送付する場合、事前に「カタログで商品を購入しそうな会員」の予測モデルをマイニングによって作成したうえで、スコアリングでモデルに近い会員を抽出します。スコアに基づいて抽出した会員に実際にカタログを送ってレスポンス率を検証、結果に基づいて次の仮説を組み立てる……というようにPDCAをまわしていきます。

★顧客育成施策編資料ダウンロードはこちら★

顧客と「つながる」ためのデータマイニング

一般にデータマイニングにおいては、分析に用いるデータの量と種類が豊富なほど、得られる知見の幅や精度を上げていくことができると考えられています。このため、昨今では社内に蓄積された顧客情報だけでなく、外部から得られる情報を合わせて分析することで、顧客に対するより深い洞察を得ようとする試みに注目が集まっています。

米国内に900を超えるケアセンターを持つノースカロライナのCarolinas HealthCare System(以下、CHS)の行っている試みも、データマイニングに積極的な事例のひとつです。CHSでは顧客に関するさまざまなデータを業者から購入し、自社の持つデータとひもづけて分析することで、顧客の健康に関するリスクを事前に察知しようとしています。

将来的には、肥満治療中の顧客がスイーツ・バーでケーキを食べた直後に、CHSの担当医師からお叱りのメールが届くようなことが実現するかもしれません。

個人情報の売買が禁じられていない米国ならではの事例ではありますが、日本においても、予防医療でのデータマイニング活用も今後進むと考えられます。

顧客の声の分析、テキストマイニング

また、最近のビッグデータ活用としては、SNSを活用した「ソーシャルリスニング」も盛り上がりを見せています。SNS上のテキストデータを分析することで、従来のマーケティング調査では得られない、「生の声」に基づくインサイトを得ることができると期待されています。

しかし、おおむねSNSの声はテキストデータ(定性データ)であるため、一般的な統計解析処理やデータマイニング処理は不可能です。そこで進化してきているのが「テキストマイニング」という技術。テキストを名詞や副詞、動詞などに分解、分類し、係り受けなどを見ながら、ポジネガ判定や出現頻度の集計などを行って、書き手の本音を分析します。SNSの生の声のほか、顧客アンケートの自由回答、コールセンターに寄せられたお客さまの声などもテキストマイニングで分析することができます。

ソーシャルリスニングとは

ソーシャルリスニングとは、ソーシャルメディア上の顧客の声を、文字通り「リスニング(傾聴)」することです。

従来、企業はアンケートやグループインタビューなどの手法を用いて顧客の声を集めてきましたが、SNSの爆発的な普及により、インターネット上から比較的容易に消費者の生の声を集められるようになりました。SNS上に流れるさまざまな情報を収集・分析し、その結果から得られる知見をマーケティングやその他の企業活動の指針に取り入れる企業もあります。

テキストマイニングのトレンド

テキストマイニングは、そもそも定性データが対象で、データマイニングとは全く違う技術です。テキストは宝の山ではありますが、意味のない言葉や大量の流用(アフィリエイトなど)、同音異義語、流行語、ローカルワードなど雑多なテキストが混じりあっているため、テキストマイニング以前のクレンジングや辞書作りに相当な手間と時間がかかっていました。日本語独特の言語構造が、分析をさらに難しくしています。

昨今注目を浴びているのは人工知能を使ったテキストマイニングです。テキストに潜む感情を読み取ったり、さまざまな記事を要約したり、会話の中の受け応えのパターンを抽出するといった、従来人手でやってきたことを人工知能に任せられるようになってきました。営業日報やメールのやり取りから営業の評価を判定したり、インターネット上からテキストを集めて1本の編集記事を書いてしまうAIもあるようです。Webサイトでの問い合わせやコールセンター応対ではチャットや自動応答を取り入れる企業も増えていることから、今後お客さまへの対応機能においてAI+テキストマイニングはますます浸透すると考えられます。

立体的なデータ分析を企業活動に生かしていく

マーケティングを取り巻く環境はここ数年で目覚ましく変化し、今や「データ分析なきマーケティング」は考えられない時代となりました。この傾向は今後もますます進み、顧客データはもちろんのこと、SNSやコールセンターの生の声、Webのログ、オープンデータなどなどあらゆるデータの収集・分析・活用が、企業活動全体の成果を左右する時代となっていくことが予想されます。

自社にとって必要十分なデータを効率よく収集し、立体的に分析して活用するための基盤を整えていくことが、今後の企業活動の勝負を分けることになるのかもしれません。

多くの情報がネットにあふれる現在、分析の対象となるデータも膨大な量になり、その扱いに頭を悩ませることも少なくないかもしれません。しかしデータマイニング、テキストマイニングにおいては、分析に用いるデータの量と種類が豊富なほど、得られる知見の幅や精度を上げていくと考えられているのです。つまり、より精度の高い顧客分析を行うチャンスが訪れているといえるでしょう。

データによって顧客を知る

マーケティングにおいてもっとも重要なのは「顧客を知る」ことです。

そして顧客関係性管理において何よりも重要なのは、一人ひとりの顧客に対する深い理解に基づいて、長期にわたってよい関係を築いていくということです。

個人情報を収集されることに拒否感を覚える顧客はまだまだ多く、企業のマーケティング活動へのデータ活用には慎重な配慮が必要ですが、「データに基づいて顧客を理解する」という考え方は、いずれ企業活動のスタンダードとなるでしょう。

関連記事