IBM SPSS Advanced Stastics

検定・集計の手法についてご紹介します。

Tool 複雑な関係性を分析する高度なモデリング手法

IBM SPSS Advanced Statistics は、一般化線型モデル (GENLIN)、一般化推定方程式 (GEE)、線型混合モ デル、一般線型モデル (GLM)、分散成分推定、MANOVA、Kaplan-Meier推定、Cox 回帰、モデル選択の線型、対数線型、生存分析などの多変量解析手法を搭載し、より高度な分析を効率的に実行することを可能にします。これらの分析手法は、学術研究や医学研究のほか、製造業、製薬業、市場調査などのあらゆる分野で使用され、データからより深いインサイトを得るために活用されています。

SPSS Advanced Statistics には、次の機能があります。

  • 一般線形モデル (GLM) と混合モデル。
  • 一般化線形モデル (GENLIN)。正規分布している応答の線形回帰、2値型データのロジスティック・モデル、度数データの対数線形モデルなど、広く使用される統計モデルが含まれます。
  • 線形混合モデル。階層線形モデル (HLM) とも呼ばれ、GLM プロシージャーで使用される一般線形モデルを拡張するため、相関関係と非定常的な変動を示すデータを分析できます。
  • 一般化推定方程式 (GEE)。相関性のある経時データとクラスター化されたデータに対応できるように一般化線形モデルを拡張したものです。
  • 一般化線形混合モデル (GLMM)。序数など、階層データや広範囲にわたる結果に使用されます。
  • 生存時間分析。寿命や持続時間のデータ検証に使用されます。

Screenshot SPSS Advanced Statisticsの画面イメージ

線形混合モデルの推定平均値

GLMM によって、因子の影響を説明する推定限界平均値を確認できます。

一般化線形混合モデルのモデル要約

GLMM のモデル要約では、モデルがデータにどれほど適合しているかを確認できます。

一般化線形混合モデルのビジュアル表示

GLMM はモデルのビジュアル表示によって、各因子の強度を確認できるようにしています。この例では、販売への影響が最も強い変数は promo になっています。

パラメーター推定表

モデル全体と個々の効果をまとめた従来型のパラメーター推定表です。「Coefficient」列は、それぞれのモデル・パラメーターと事後テスト・スコアとの関係を示しています。連続型フィールドの場合、この列の係数は、その連続型フィールドの値の単位増に相当するテスト・スコアの変動予想値になります。カテゴリー型フィールドの場合、この列の係数は、そのカテゴリー型フィールドの参照カテゴリーの相対的なテスト・スコアの変動予想値になります。

inspection 詳細情報

一般線形モデル (GLM)

  • 従属変数と複数の独立変数の間の関係性を表します。モデルには、線形回帰、分散分析 (ANOVA)、共分散分析 (ANCOVA)、多変量分散分析 (MANOVA)、多変量共分散分析 (MANCOVA) などがあります。
  • 設計と対比の柔軟なオプションを使用して、平均値と分散の推定、および平均値の検定と予測を行います。
  • カテゴリー型と連続型の因子を組み合わせ、可能性のある多数のモデル構築法の中から選択してモデルを構築できます。
  • 顧客の購買傾向を予測するなど、非線形の結果を予測する場合は、階層的なネストしたデータ構造も考慮して線形混合モデルを使用すると、さらに精度が高まります。
  • 分割プロット設計、固定効果共分散を使用したマルチレベル・モデル、任意配列完全ブロック設計など、多数のモデルを作成できます。

一般化線形モデル (GENLIN)

  • 正規分布している従属変数を扱う従来の線形モデル、2 値型データを扱うロジスティック・モデルやプロビット・モデル、度数データを扱う対数線形モデル、およびその他の標準的でない回帰型モデル等に関して、共通の枠組みを提供します。
  • 順序回帰、Tweedie 回帰、ポアソン回帰、ガンマ回帰、負の二項回帰など、多数の有用な一般統計モデルを適用します。

線形混合モデル/階層線形モデル (HLM)

  • 教室の中でネストされた生徒や、家族の中でネストされた消費者など、相関関係と非定常的な変動を示すデータの平均値、分散、共分散をモデル化します。
  • 分割プロット設計、固定効果共分散を使用したマルチレベル・モデル、任意配列完全ブロック設計など、多数のモデルを作成できます。
  • 1 次の前従属、不均質、および 1 次の自己回帰など、11 種類の非空間的共分散タイプから選択できます。
  • 反復測定の数が異なる場合、それぞれのケースの時間間隔が異なる場合、あるいは両方の場合など、反復測定データを処理するときに、より精度の高い結果を得られます。

一般化推定方程式 (GEE) プロシージャー

  • 一般化線形モデルを拡張して、相関性のある経時データとクラスター化されたデータを処理します。
  • 対象内の相関をモデル化します。

一般化線形混合モデル (GLMM)

  • 調査データ、企業データベース、Web からダウンロードしたデータなど、事実上あらゆる種類のデータ・セットにアクセスし、管理と分析を実行できます。
  • 顧客満足度のレベルが低、中、高のどのカテゴリーに入るかなどの非線形の結果を予測する場合は、序数を使用する GLMM プロシージャーを実行すると、より精度の高いモデルを構築できます。

生存分析プロシージャー

  • 部品故障、死亡率、生存率などの終結現象を把握するために用意された柔軟で包括的な一連の手法の中から選択できます。
  • Kaplan-Meier(カプランマイヤー) を使用して事象発生までの時間の長さを測定します。
  • Cox 回帰を選択すると、応答までの時間や応答持続時間を従属変数として使用した比例ハザード回帰を実行できます。