ピアソンの積率相関係数のソースを表示
←
ピアソンの積率相関係数
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
[[画像:Correlation examples2.svg|400px|thumb|[[散布図]]とそのピアソンの積率相関係数の一覧。相関は線形性および直線関係の向きを反映するが(上段)、その関係の傾きや(中段)、非直線関係の多くの面も反映しない(下段)。中央の図の傾きは0であるが、この場合は''Y''の分散が0であるため相関係数は定義されない。]] '''ピアソンの積率相関係数'''(ピアソンのせきりつそうかんけいすう、{{lang-en-short|Pearson correlation coefficient, PCC}})とは、2つの[[データ]]または[[確率変数]]の間にある線形な関係の強弱を測る指標である<ref>{{Cite book|和書 |author1=栗原伸一 |year=2011 |title=入門統計学―検定から多変量解析・実験計画法まで |url={{google books|r5JIE8QbPbAC|page=17|plainurl=yes}} |publisher=[[オーム社]] |isbn=978-4-274-06855-3 |ref=harv|page=18}}</ref><ref>{{Cite book |last1=Drouet Mari |first1=Dominique |last2=Kotz |first2=Samuel |year=2001 |title=Correlation and Dependence |url={{google books|xvG3CgAAQBAJ|plainurl=yes}} |publisher=Imperial College Press |isbn=1-86094-264-4 |mr=1835042 |ref=harv|page=11|chapter=2.2.1. Linear relationship}}</ref>。[[カール・ピアソン]]が研究した。一般的に、単に[[相関係数]]といえばピアソンの積率相関係数を指す。 ピアソンの積率相関係数は[[無次元量]]で、−1以上1以下の[[実数]]に値をとる。相関係数が[[正の数と負の数|正]]のとき確率変数には'''正の相関'''が、負のとき確率変数には'''負の相関'''があるという。また相関係数が0のとき確率変数は'''無相関'''であるという<ref>{{Cite book|和書 |author=稲垣宣生 |year=1990 |title=数理統計学 |publisher=[[裳華房]] |isbn=4-7853-1406-0 |ref=harv|page=66}}</ref><ref>[[伏見康治]]「[[確率論及統計論]]」第III章 記述的統計学 21節 2偶然量の相関 p.146 ISBN 9784874720127 http://ebsa.ism.ac.jp/ebooks/ebook/204</ref>。 たとえば、[[先進諸国]]の[[失業率]]と[[実質経済成長率]]は強い負の相関関係にあり、相関係数を求めれば−1に近い数字になる。 相関係数が ±1 に値をとることは、2つのデータ(確率変数)が線形の関係にあるときに限る<ref>{{Cite book|和書 |author=稲垣宣生 |year=1990 |title=数理統計学 |publisher=[[裳華房]] |isbn=4-7853-1406-0 |ref=harv|quote=定理4.2.ii}}</ref>。また2つの確率変数が互いに[[独立 (確率論)|独立]]ならば相関係数は 0 となるが、逆は成り立たない。 == 定義 == === 母集団相関係数 === 正の[[分散 (確率論)|分散]]を持つ[[確率変数]] {{math2|''X'', ''Y''}} が与えられたとき、[[共分散]]を <math>\operatorname{cov} [X,Y]</math>、[[標準偏差]]を {{math2|''σ{{sub|X}}'', ''σ{{sub|Y}}''}} とおく。このとき :<math>\rho = \frac{\operatorname{cov} [X,Y]}{\sigma_X \sigma_Y}</math> を確率変数 {{mvar|X}} と {{mvar|Y}} の[[母集団]]のピアソンの積率相関係数という。これは[[期待値]]を {{math|''E''[…]}} で表せば :<math>\rho = \frac{E \left[ \left( X-E \left[ X \right] \right) \left( Y-E \left[ Y \right] \right) \right]}{\sqrt{E \left[ \left( X- E \left[ X \right] \right)^2 \right] E \left[ \left( Y-E \left[ Y \right] \right)^2 \right]}}</math> と書き直すこともできる。 === 標本相関係数 === 大きさの同じ2個のデータ {{math2|(''x''{{sub|1}}, ''x''{{sub|2}}, …, ''x{{sub|n}}''), (''y''{{sub|1}}, ''y''{{sub|2}}, …, ''y{{sub|n}}'')}} に対して、標本[[共分散]]を {{math|''s{{sub|xy}}''}}、[[標準偏差#標本の標準偏差|標本標準偏差]]をそれぞれ {{math2|''s{{sub|x}}'', ''s{{sub|y}}''}} とおく。このとき :<math>r:= \frac{s_{xy}}{s_x s_y} = \frac{\sum\limits_{i=1}^n \left( x_i-\overline{x} \right) \left( y_i-\overline{y} \right)}{\sqrt{\sum\limits_{i=1}^n (x_i-\overline{x})^2 \sum\limits_{i=1}^n (y_i-\overline{y})^2}}</math> を標本相関係数 (sample correlation coefficient) あるいは[[標本 (統計学)|標本]]のピアソンの積率相関係数という。ただし、{{math2|{{overline|''x''}}, {{overline|''y''}}}} はそれぞれデータ {{math2|(''x''{{sub|1}}, ''x''{{sub|2}}, …, ''x{{sub|n}}''), (''y''{{sub|1}}, ''y''{{sub|2}}, …, ''y{{sub|n}}'')}} の[[算術平均|平均値]]で、<math>\overline{x} = \frac{1}{n} \textstyle\sum\limits_{i=1}^n x_i</math>, <math>\overline{y} = \frac{1}{n} \textstyle\sum\limits_{i=1}^n y_i</math> である。 相関係数は、[[幾何学]]的には次のような意味になる。 データ {{math2|(''x''{{sub|1}}, ''x''{{sub|2}}, …, ''x{{sub|n}}''), (''y''{{sub|1}}, ''y''{{sub|2}}, …, ''y{{sub|n}}'')}} をそれぞれ {{mvar|n}} 次の[[列ベクトル]] {{math|'''''x''''' {{=}} [''x''{{sub|1}} ''x''{{sub|2}} ... ''x''{{sub|''n''}}]{{mtop|.}}, '''''y''''' {{=}} [''y''{{sub|1}} ''y''{{sub|2}} ... ''y''{{sub|''n''}}]{{mtop|.}}}} と考えると、{{math|'''''x''''', '''''y'''''}} の[[偏差]]ベクトルはそれぞれ以下のようになる。 :<math>\boldsymbol{x}-\overline{x}\,\boldsymbol{1}=\begin{bmatrix} x_1-\overline{x} \\ x_2-\overline{x} \\ \vdots \\ x_n-\overline{x} \end{bmatrix}, \; \boldsymbol{y}-\overline{y}\,\boldsymbol{1}=\begin{bmatrix} y_1-\overline{y} \\ y_2-\overline{y} \\ \vdots \\ y_n-\overline{y} \end{bmatrix}</math> ただし、{{math|'''1'''}} は全ての成分が1である {{mvar|n}} 次の列ベクトルで、{{math|'''1''' {{=}} [1 1 ... 1]{{mtop|.}}}} である。このとき、{{math|'''''x''''', '''''y'''''}} の[[偏差]]ベクトル {{math|'''''x''''' − {{overline|''x''}} '''1''', '''''y''''' − {{overline|''y''}} '''1'''}} の[[ベクトルのなす角|なす角]]を {{mvar|θ}} としたときの :<math>\cos \theta =\frac{\langle \boldsymbol{x}-\overline{x}\,\boldsymbol{1},\;\boldsymbol{y}-\overline{y}\,\boldsymbol{1} \rangle}{\| \boldsymbol{x}-\overline{x}\,\boldsymbol{1} \| \| \boldsymbol{y}-\overline{y}\,\boldsymbol{1} \|}</math> が標本相関係数 {{mvar|r}} である。ここで、{{math|{{angbr|●, ●}}}} は[[内積]]を表す。 データ {{math|(''x''{{sub|1}}, ''x''{{sub|2}}, …, ''x{{sub|n}}''), (''y''{{sub|1}}, ''y''{{sub|2}}, ..., ''y{{sub|n}}'')}} が2次元[[正規分布]]からの標本のとき、標本相関係数 {{mvar|r}} は母集団相関係数 {{mvar|ρ}} の[[最尤推定]]量ではあるが、[[偏り#推定量の偏り|不偏推定量]]ではなく(絶対値で見ると)小さめに見積もりがちである<ref>{{Cite book |last1=Hedges |first1=Larry V. |last2=Olkin |first2=Ingram |year=1985 |title=Statistical Methods for Meta-Analysis |page=225}}</ref>。また[[外れ値]]に大きく影響してしまう。 ==例== 下のような<math>X</math>と<math>Y</math>の[[同時確率分布]]を考える。 {| class="wikitable" |- |<math>\operatorname{P}(X=x,Y=y)</math> |<math>y=-1</math> |<math>y=0</math> |<math>y=1</math> |- |<math>x=0</math> |<math>0</math> |<math>1/3</math> |<math>0</math> |- |<math>x=1</math> |<math>1/3</math> |<math>0</math> |<math>1/3</math> |} この同時分布の場合、[[周辺分布]]は以下のようになる。 :<math>\operatorname{P}(X=x)= \begin{cases} 1/3 & \quad \text{for } x=0 \\ 2/3 & \quad \text{for } x=1 \end{cases} </math> :<math>\operatorname{P}(Y=y)= \begin{cases} 1/3 & \quad \text{for } y=-1 \\ 1/3 & \quad \text{for } y=0 \\ 1/3 & \quad \text{for } y=1 \end{cases} </math> ここから以下の期待値および分散値が得られる。 :<math>\mu_X = 2/3</math> :<math>\mu_Y = 0</math> :<math>\sigma_X^2 = 2/9</math> :<math>\sigma_Y^2 = 2/3</math> したがって、相関係数<math>\rho_{X,Y}</math>は次の通り。 : <math> \begin{align} \rho_{X,Y} & = \frac{1}{\sigma_X \sigma_Y} \operatorname{E}[(X-\mu_X)(Y-\mu_Y)] \\[5pt] & = \frac{1}{\sigma_X \sigma_Y} \sum_{x,y}{(x-\mu_X)(y-\mu_Y) \operatorname{P}(X=x,Y=y)} \\[5pt] & = (1-2/3)(-1-0)\frac{1}{3} + (0-2/3)(0-0)\frac{1}{3} + (1-2/3)(1-0)\frac{1}{3} = 0. \end{align} </math> (すなわち「無相関」である) == 誤解や誤用 == {{Excerpt|相関係数|誤解や誤用|subsections=yes|references=no}} == 脚注 == {{Reflist|2}} == 関連項目 == *[[統計学]] **[[回帰分析]] **[[コピュラ (統計学)]] **[[相関関数]] **[[交絡]] **[[相関関係と因果関係]]、[[擬似相関]]、[[錯誤相関]] *[[自己相関]] *[[HARKing]] {{統計学}} {{Normdaten}} {{DEFAULTSORT:そうかんけいすう}} [[Category:確率論]] [[Category:統計学]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Excerpt
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Math
(
ソースを閲覧
)
テンプレート:Math2
(
ソースを閲覧
)
テンプレート:Mvar
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
ピアソンの積率相関係数
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報