データマイニング(テキストマイニング)

データマイニング(テキストマイニング)とは、顧客の購買履歴やクレジットカードの利用履歴など、企業に蓄積された膨大なデータを網羅的に分析することによって商品やサービスにおける相関関係や法則性を見つけ出す手法、またはプロセスのこと。よく取り上げられる例として、「雨の日は肉がよく売れる」「紙オムツと一緒にビールが買われることが多い」などがある。

データマイニングに用いられる手法としては、同時に購入された商品からデータ同士の関係性を分析する「マーケット・バスケット分析(アソシエーション分析)」、購買行動のデータから顧客をグループに分ける「クラスター分析(クラスタリング)」、顧客データから購入確率の予測をする「ロジスティック回帰分析」の3つがある。

データマイニングは法則性や関係性を見つけ出すことを目的としているが、データ自体には不必要な情報やノイズも多いため、いかに科学的アプローチによってそれらを発見し問題を解決できるかが重要。