データマイニング手法

データマイニングの手法についてご紹介します。

inspection Two-Step

大量のケースをクラスタ化するためのもので、類似度の基準に基づいて観測値をグルーピングします。

使用されるSPSSソフトウェア
IBM SPSS Modeler

inspection Apriori

データ群から関連性のあるルールを見つけるためのアルゴリズムです。

使用されるSPSSソフトウェア
IBM SPSS Modeler

inspection GRI

Generalized Rule Inductionの略称で、データのアソシエーションルール(事象間の関連性)を発見するためのものです。

使用されるSPSSソフトウェア
IBM SPSS Statistics Base

inspection デジョンツリー(決定木)

決定木分析(ディシジョンツリー)は、データ内のセグメント、パターン、階層関係を樹木の形で視覚的に表現したものです。
データマイニングにおける決定木分析は与えられたセグメント情報に合うように分類基準を作る教師付き学習を行います。対象データ全体を最もよく分類できる変数を探索するアルゴリズムによって、データを分類し判別・予測のルールを作成します。主なアルゴリズムにC&RT、C5.0、CHAIDなどがあります。デシジョンツリーとも呼ばれます 。

使用されるSPSSソフトウェア
IBM SPSS Statistics Base
IBM SPSS Decision Trees
IBM SPSS Modeler

inspection ニューラルネットワーク

ニューラルネットワークとはヒトの脳の情報処理を模倣したモデリング手法のことです。
代表的なデータマイニングアルゴリズムのひとつで、人工知能を利用した複雑な数式を実現しています。ニューラルネットワークは、ネットワークを構成しているいくつかのニューロンからできており、次の図に示すように、層で編成されているため多層パーセプトロン(マルチレイヤーパーセプトロン)とも呼ばれます。
ニューラルネットワークでは、ニューロン間が接続されることで、データ間のパターンや関係をネットワークが学習できるようになります。観測されたケースを1つずつ扱って、繰り返し更新し続けることで学習を行い、完全に学習が終わったネットワークにおいては、新しい未知のデータを与えても、それまでの経験に基づいて意思決定や予測を行うことができます。
ニューラルネットワーク活用例
商品需要予測:
ニューラルネットワークを利用した商品需要予測の最適化
商品開発:
調味料の開発にニューラルネットワークを適用、缶コーヒーのにおいの官能評価
エレベーター運転方式制御: エレベーターの最適スケジューリング制御
自然言語処理:
ニューラルネットワークによる学習を用いた自然言語の処理
手書き数字の認識:
ニューラルネットワークによる手書き数字認識システム
顔画像認識:
目、口、鼻のカテゴリーを形成してニューラルネットワークで顔を認識

使用されるSPSSソフトウェア
IBM SPSS Statistics Base
IBM SPSS Modeler
IBM SPSS Neural Networks