「ビッグデータ」が流行語候補として取りざたされた2013年、同時期に注目されたのが「データマイニング」です。聞いたことはあるという方が多いのではないでしょうか?
ビッグデータ活用が多くの企業にとって現実的ではなかった数年前には、言葉だけが先行して実際にデータマイニングを実施できているという企業はほとんど存在せずごく一部の大手企業のみでした。しかし、データ基盤とデータ分析技術の発展により、データマイニングは今まさに脚光を浴びています。
本稿では、そんなデータマイニングについて基本から解説します。加えて、気になるマイニングツールとBIツールの違いについてもご紹介します。
データマニングとは?
データマイニング(Data Mining)という言葉は日本語で「データを採掘する」という意味があります。この「マイニング(採掘)」という言葉から、データマイニングはまるで「広大な鉱山から金脈を発見するようなもの」と想像されがちですが、実際はどうでしょうか?
データマイニングについて解説するにあたって、よく「おむつとビールを併売したら売り上げが上がった」という事例を耳にします。これは「おむつを買ってきて欲しい」と頼まれた父親がスーパーマーケットに行ったところ、同じタイミングでビールを購入することが多かったということに起因しています。
「おむつ」と「ビール」は一見してまったく相関関係がありません。しかし、「おむつとビールがよく一緒に購入されている」という事実から仮説を立てて、データを分析することで、各データの繋がりを発見してビジネスに有用な知見を導き出す。これがデータマイニングというものです。
この、おむつとビールの事例が事実かどうかは分りませんが、データマイニングについて説明する上では分かりやすい事例の1つだと言えるでしょう。以上のことから、データマイニングとは「顧客の購買パターンの分析や統計的な数値の解析などを通じて、経営の最適化を図ること」となります。
データマイニングに用いられる3つの手法
データマイニングでは複数の分析手法を組み合わせて使用します。その分析手法を使用するかは、目的に応じて異なります。ここではその手法を3つご紹介します。これらはデータマイニングのロジックの一部になりますが代表的なものですのでご確認ください。
1.データ間の関係性を明らかにする「マーケット・バスケット分析」
データ間に隠れている関係性を明らかにすることで、ビジネスに有用な知見を見出すための分析手法がマーケット・バスケット分析です。たとえばPOSデータを分析する際は、「どの商品とどの商品が、どのような顧客に購入されているのか?」を分析します。先ほどご紹介したおむつとビールの事例が、このマーケット・バスケット分析に分類されるでしょう。
ECサイトにおいては「レコメンド機能」によく使われています。この機能は、商品Aを購入した人に、同じ商品Aを購入した他の人が、よく購入している商品Bをおすすめするといった機能です。その根拠はともかく、統計的に合わせてよく購入される商品をすすめることで、顧客単価を上げることができます。
2.様々な角度でデータを分類する「クラスター分析」
クラスター分析は「階層クラスター分析」と「非階層クラスター分析」の2種類に分類されます。
階層クラスター分析とは、最も似ている組み合わせから順にデータ分類していく手法です。一方、非階層クラスター分析とは、階層構造を持たない膨大なデータを分類するための手法であり、主にビッグデータ分析に用いられます。
3.事象の発生確率を予測する「ロジスティック回帰分析」
事象の発生確率を予測するための分析手法として有名なのがロジスティック回帰分析です。企業では主に、マーケティング施策に対する顧客の反応改善のために使われています。
ロジスティック回帰分析は事象の発生からさかのぼってデータ分析を実施することにより、将来的に発生する事象を予測したり、あるいは商品を購入した顧客の人物像を明らかにしたりと、様々な分野で使用されています。
[RELATED_POSTS]マイニングツールとBIツール
データマイニングをツールとして利用する「マイニングツール」、それと昨今のビジネス環境に欠かせない分析ソリューションの「BIツール」は何が違うのでしょうか?
まず、マイニングツールとは文字通り「データマイニングを行うためのツール」です。分析したいデータを取り込み、分析手法を選択することでデータ間に隠れている関係性を明らかにしたり、事象の発生確率を計算したりと色々な機能で日々のデータ分析をサポートしてくれます。
一方、BIツールとは「BI(Business Intelligence)」という概念にもとづきデータの可視化・分析を提供するツールです。BI(Business Intelligence)とはいわば、「誰もがデータサイエンティストのようにデータ分析できる環境を整え、経営や業務における意思決定を早める」という概念であり、このBI(Business Intelligence)をツールとして落とし込んだのがBIツールとなります。
具体的にどういった機能があるかというと、BIツールにはマイニングツールのような分析機能も含まれていますし、OLAP分析やシミュレーション解析といった複数の分析機能が備わっているのが一般的です。そのため、必要なデータを取り込んで分析手法さえ選択すれば、様々な角度からビジネスに有用な知見を導き出したり、リスクの発生確率を計算したりと、いろいろな活用方法があります。
マイニングツールといったらデータマイニングを実施するための機能だけが備わっており、BIツールといったデータマイニングに加えて様々なデータ分析が実現できるものとお考え下さい。
しかし、昨今のこの領域はツールという観点で言うとどちらも同じような機能が搭載されてきており、その垣根はなくなりつつあることも事実です。
[SMART_CONTENT]
データ分析のためのツールは必要か?不要か?
「データドリブン○○(データ分析をもとにした○○)」という言葉をよく見聞きします。たとえば「データドリブン経営」ならば、「データ分析を行いその結果から経営活動方針を決定し、経営意思決定を迅速にすると共に、より正確な経営活動を持続していく」という意味が込められています。
こうした言葉が流行していることから、データ分析は多くの企業にとって必要不可欠な存在として認識されている、と考えてよいでしょう。ただし、必ずしも必要というわけではありません。データ分析を実施しなくても究明できる原因や、解決できる問題はたくさんあります。大切なのは、データ分析は何のために必要かを明確に定義した上で、どういったシーンで活用するかを設定することです。
必要か不要かと聞かれれば、データ分析はすべての企業にとって必要です。大量のデータを分析するための基盤・技術は既に整っており、データサイエンティストがいない環境でも高度なデータ分析を実現しています。つまり、今まではデータ分析を実施していなかった企業の多くが、データ分析によってより高度な経営を実施してくる可能性があります。これに対応し、競合優位性を獲得・持続するためにはやはりデータ分析で対抗する他ありません。
また、企業のデータの多くはERP(Enterprise Resource Planning)に統合されており、例えばOracle NetSuiteであれば標準でデータ分析機能やダッシュボード、レポーティングといった機能が搭載されています。このようなERPを導入することでデータドリブンな経営ができることをご理解いただければ幸いです。
- カテゴリ:
- データ分析/BI
- キーワード:
- bi
- マイニング
- ビジネスインテリジェンス