相関係数は、2 つの事柄がどの程度関連しているかを示す指標です。 r と略される相関係数は、散布図のデータがどれだけ直線に沿っているかを示します。実際の r 値が 1 に近いほど、線形方程式はデータをより適切に表現できます。 r 値が 0 に近いデータセットには、ほとんど直線関係はありません。 r =1 または r =–1 の場合、データ コレクションは整列されます。
以下は、3 種類の相関係数です。
- ピアソンの相関係数
- スピアマンの相関
- ケンダルの関係
相関係数の計算式
次の式を使用して、サンプルの相関係数を表すことができます:
r= ∑[( × 私 − × )( はい 私 − はい )] √Σ( × 私 − × ) 2 ∗ Σ( はい 私 − はい ) 2
( × 私 、 はい 私 ) =データのペア
x̅ =x の平均 私
s(y) =y 座標の 2 番目の座標 (i) の偏差
つ =y の平均 私
重要なポイント
- 2 つの変数間の関係の強さは、相関係数を使用して測定されます。
- 統計では、相関係数が一般的に使用されます。この指標は、2 変数の線形関係の方向と強さを評価します。
- 値は常に -1 (強い負の関係) と +1 (強い正の関係) の間です。値がゼロまたはゼロに近い場合、線形関係は弱いか存在しません。
- +0.8 未満または -0.8 を超える相関係数は重要ではないと見なされます。
相関係数の計算手順
<オール>計算を開始するには、使用する変数のチェックリストを作成します。データセットを作成したら、これらの数値を方程式に組み込みます。これらの値は、x 変数と y 変数を使用して区切られます。
-
x 変数ごとに、標準化された値を計算します。
データセットを選択した後、次の方程式を使用して、各 x(i) 変数の標準化された値を決定します。
(z( × 私 ) ) =( × 私 – x̅) / s(x)
- 各 y 変数について、標準化された値を計算します。
各 x(i) の標準化された値を決定したら、次の式を使用して各 y(i) の標準化された値を決定します。
(z( はい 私 ))=( はい 私 – ų) / s(y)
-
掛け算と足し算で合計を求めます。
前の手順で取得した標準化された値を掛けます。以下に示す式を使用してください:
(z( × 私 )) * (z( はい 私 ))
数字を掛けた後、それらを合計して合計を取得します。
- 合計を割って相関係数を計算します。
次のステップで、n を使用して、この情報ペアの合計ポイントを示します。ステップ 4 で得られた結果から n–1 を引きます。
結論
相関係数は、2 つの変数間の関係の強さを評価するために使用されます。相関係数には、2 つの変数間の関係の条件が前に付けられます。相関係数は「r」で表されます。使用している変数または情報を理解することで、最も高い相関係数を選択できます。