相関係数
相関係数は、2変数間の線形関係の程度を表す係数です。
相関係数の値の範囲は-1から+1で、符号が「+」であれば正の相関(片方が大きくなれば、他方も大きくなる関係)、符号が「-」であれば負の相関(片方が大きくなれば、他方は小さくなる関係)を表します。
また、相関係数の絶対値が1に近いほど、より強い線形関係を表しています。
相関係数の求め方
相関係数の計算式

同じ記号(S)ですが、分子は分散、分母は標準偏差です。
分散の単位は(元の単位)^2、標準偏差の単位は元の単位なので、分母分子で約分されて、相関係数の単位はなくなります。
2変数それぞれの標準偏差を使用しますので、標準偏差について知りたい場合は、以下のページを参考にしてください。
相関係数の算出例
次のような年齢と給料のデータがあります。ここから、相関係数を求めてみましょう。
ちなみに、計算すると年齢の平均値は34歳、給料の平均値は30.5万です。

①共分散を求める(分子に使用)
年齢と給料それぞれの偏差(平均値からの差)を掛けた値の平均値です。
{(20-34)(20-30.5)+(27-34)(25-30.5)+(39-34)(37-30.5)+(50-34)(40-30.5)}÷4=92.5
②各変数の標準偏差を求める(分母に使用)
偏差(平均値からの差)の2乗の平均値をルートした値です。
年齢:√[{(20-34)^2+(27-34)^2+(39-34)^2+(50-34)^2}÷ 4]≒11.467
給料:√[{(20-30.5)^2+(25-30.5)^2+(37-30.5)^2+(40-30.5)^2}÷ 4]≒8.261
③相関係数の計算式に代入する
92.5÷(11.467×8.261)≒0.976
相関係数は0.976となりました。
絶対値が1に近いため、かなり強い相関があると言えます。
解釈の注意点
相関関係は因果関係とは異なる
相関係数の絶対値が1に近いほど、強い相関関係があると言えます。
ここで注意したいのは、「相関関係」は「因果関係」ではないという事です。
例えば、あるダイエット水について、「飲む回数が多い人は体重が減る」という結果が得られたとします。ここに相関関係はありますが、因果関係は不明です。
ダイエット水を飲むことで、ダイエット意識が向上し、よく階段を使用するようになっていたのなら、体重の減少と因果関係があるのは、「適度な運動による脂肪燃焼」となります。
このように、相関係数から直接、因果関係を述べることはできないので、2つの変数が持つ背景については、よく考察する必要があります。
曲線の関係については分からない
相関係数は、直線的な関係を表現しています。
従って、綺麗な曲線的な関係があったとしても、絶対値は1に近づきません。
相関係数の絶対値が1に近くない場合でも、2変数間に全く関係がないとは言えませんので、散布図まで確認するようにしましょう。
まとめ
相関係数は、2変数間の線形関係の程度を表す係数で、相関係数の絶対値が1に近いほど、より強い線形関係を表しています。
また、相関係数の値の範囲は-1から+1で、符号が「+」であれば正の相関、符号が「-」であれば負の相関を表します。
相関の考察においては注意が必要で、2つの変数間にどのような繋がりがあるのか、第3の関連因子はないか、など注意深く考察する必要があります。
コメント