IBM SPSS Data Preparation

検定・集計の手法についてご紹介します。

Tool データ準備の改善で結果の精度を高める

IBM SPSS Data Preparation では、分析プロセスのデータ準備段階を合理化する高度な手法を使用して、短時間でより精度の高いデータ分析結果を得ることができます。分析担当者は、完全に自動化されたデータ準備手続きを選択してすぐに結果を得ることも、別の方法を選択してより難易度の高いデータ・セットを準備することもできます。

このソフトウェアを使用すると、疑わしい、または無効なケース、変数、およびデータ値を、簡単に特定できます。 また、欠損データのパターン表示や変数分布の要約を行ったり、名義属性に対して設計されたアルゴリズムをより正確に操作したりできます。
SPSS Data Preparation は、次の点で役立ちます。
・データ準備プロセスの自動化: 複雑で時間のかかる手作業のデータ準備をなくします。
・手動チェックなしのデータ検証: 短時間でより正確にデータを検証できます。
・外れ値による分析の偏りを防止: 誤った結果を招くおそれのある異常値を自動的に検出します。

SPSS Data Preparation は、次の点で役立ちます。

  • データ準備プロセスの自動化: 複雑で時間のかかる手作業のデータ準備をなくします。
  • 手動チェックなしのデータ検証: 短時間でより正確にデータを検証できます。
  • 外れ値による分析の偏りを防止: 誤った結果を招くおそれのある異常値を自動的に検出します。

Screenshot SPSS Data Preparationの画面イメージ

データ準備の自動化

データ準備自動化機能を使用すれば、面倒な反復作業を自動化して分析用のデータを準備できます。その結果、分析を加速化し、予測機能を強化し、堅牢性を高め、生データの状態では除外された可能性のあるデータを組み込むことが可能になります。

データの検証

データ検証ツールを使用すれば、アクティブなデータ・セットの中で、疑わしいケースや無効なケース、疑わしい変数や無効な変数、疑わしいデータ値や無効なデータ値を見つけ出すことができます。例えば、お客様の満足度に関する月例レポートを顧客に提供するデータ分析担当者であれば、この機能を使用して、不備のあるカスタマー ID や、有効範囲外の変数値、しばしば誤入力される変数値の組み合わせなどを確認できます。

変則事象の検出理由の要約

この表は、各変数の役割を主な理由としてまとめたものです。変数ごとに最小値、最大値、平均値の影響をまとめ、複数のケースの理由になっている変数については標準偏差を示すことによって、変数の影響に関する統計を要約しています。

データ検証のケース・レポート

このケース・レポートでは、変数間のルールに違反したケースと、単一変数のルールに違反したケースをまとめています。これらのケースについては、修正のためにデータ入力のスタッフにすべて報告する必要があります。

inspection 詳細情報

データ準備プロセスの自動化

  • 1 ステップでデータを準備できます。
  • 質的エラーを検出、修正し、欠損値を補完します。
  • 分析で使用するデータを素早く決定できます。
  • 推奨事項を示す、視覚に訴えるわかりやすいレポートを表示します。

手動チェックなしのデータ検証

  • プロジェクト間で一貫性のあるデータ検証を徹底できます。
  • 各変数の尺度水準 (カテゴリー型か連続型か) に基づいて検証規則を適用できます。
  • 無効なケース、規則違反の要約、および影響を受けるケース数についてのレポートを受け取ることができます。
  • 分析前に自分の判断で疑わしいケースを除去または修正できます。

外れ値による分析の偏りの防止

  • 類似ケースからの逸脱に基づいて異常ケースを検索できます。
  • 新しい変数を作成して外れ値にフラグを付けることができます。
  • 異常ケースを検査して分析に含めるべきかどうかを判断できます。