データマイニング
データマイニングとは、単なるデータの集合の中から隠れた法則や関係性を発見することを言います。英語ではdata miningと表記されます。

データの山の中から、有益な情報を採掘(マイニング:mining)するというイメージの言葉ですね。
  • どうしてそんな事をするの?
企業が日々の業務を行ってくと、大量のデータが蓄積されていきます。例えば、日々の気温や天候やPOSレジの導入による販売履歴等です。

ただ、これらの情報をバラバラに見ていてはなかなかそこに潜む関係性に気づくことができません。

そこで、ITの力を借りて、膨大なデータの中にある隠れた関係性を探し出しましょうというアプローチが生まれました。

このような考え方をデータマイニングというのです。
  • 雨が降ったら売り上げが
ココで、雨が降ったら売り上げが低下する傾向にあるといった程度の内容ならば、別にデータマイニングなどを行わなくとも経験則で十分対応できると思います。

しかし、紙おむつとビールが一緒に売れる傾向があるという事にはなかなか気が付きにくいと思います。

データマイニングとは、こういった知識を機械的に発見していこうというアプローチなのですね。

■データマイニングとAI、機械学習

このデータマイニングという言葉は2000年代によく用いられた言葉でした。コンピュータ技術が発展したので大量のデータを調べて、隠された意味を探ると言った意味合いです。

そのような方法論を総称する言葉で、機械学習や統計解析などを総動員していたイメージです。POSデータを解析したら、ビールと紙おむつの例がわかったなど、以外な関連性を見つけることができたのです。

現在ではAIや機械学習、データサイエンスといった言葉を用いることが多くなり、データマイニングとはあんまり言わなくなりつつあります。

しかし、言い方は変わっていますが、考え方は膨大に蓄積されたビッグデータから役に立つ知識や関連性を探すと言ったアプローチであって、当時とあんまり変わっていません。

ただ、当時よりも使える道具が強力になったという事ですので、大量のデータを取得することは以前にも増して重要になって来ているのです。

関連用語
テキストマイニング