IBM SPSS Decision Trees

検定・集計の手法についてご紹介します。

Tool グループ特定と結果予測を簡単に

IBM SPSS Decision Trees を使用すると、より正確なグループ特定、グループ間の関係の発見、および将来の事象予測が可能になります。このモジュールは、きわめて視覚的な分類ツリーおよびデシジョン・ツリーを特色としています。これらのツリーにより、カテゴリー化した結果を直感的な方法で提示できるので、専門的な知識がない人に対してもカテゴリー化した分析をわかりやすく説明できます。このモジュールには4つのツリー成長アルゴリズムがあり、各タイプを試して対象データに最適なものを見つけることができます。

このモジュールは、IBM SPSS Statistics 環境で行う分類に対応した特殊なツリー構築手法を提供します。4つのツリー成長アルゴリズムは、次のとおりです。

CHAID: データを高速かつ効率的に探索し、目的とする結果を得るためのセグメントとプロファイルを構築する、高速で統計的な多方向ツリー・アルゴリズムです。
Exhaustive CHAID: CHAID を修正したもので、因子ごとにすべての可能な分割を調べます。
Classification and regression trees (C&RT): 完全な二分木アルゴリズムで、データを区切って正確な同種のサブセットを生成します。
QUEST: 変数を偏りなく選択し、正確な二分木を迅速かつ効率的に構築する統計アルゴリズムです。

Screenshot SPSS Decision Treesの画面イメージ

ダイアログ・ボックスのオープン

デシジョン・ツリーのダイアログ・ボックスを使用して、測定する従属変数と独立変数を選択し、ツリーの拡大方式を指定します。

CHAID 方式

このツリー・ダイアグラムは、ツリー・モデルのグラフィック表示です。CHAID 方式に基づくこのツリー・ダイアグラムは、収入のレベルがクレジット評価の最適な因子であることを示しています。

リスク表と分類表

リスク表と分類表を使用すれば、クレジット評価で顧客を分類するために使用したモデルの適合性を素早く評価できます。

ツリー・ベースの分類モデル

Decision Tree プロシージャーでは、ツリー構造の分類モデルを作成します。この分類モデルによって、ケースをグループごとに分類したり、独立 (因子) 変数の値に基づいて従属 (ターゲット) 変数の値を予測したりすることができます。