マハラノビス距離のソースを表示
←
マハラノビス距離
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''マハラノビス距離'''(マハラノビスきょり、{{lang-en|Mahalanobis' distance}})とは、[[統計学]]で用いられる一種の[[距離]]である。「普通の距離を一般化したもの」という意味で'''マハラノビス汎距離'''(マハラノビスはんきょり)ともいう。[[プラサンタ・チャンドラ・マハラノビス]]により[[1936年]]導入された<ref>Mahalanobis(1936)</ref>。 ==概要== ===特徴=== 多変数間の[[相関]]に基づくものであり、[[多変量解析]]に用いられる。新たな[[標本]]につき、類似性によって既知の標本との関係を明らかにするのに有用である。データの相関を考慮し、また[[尺度水準]]によらないという点で、[[ユークリッド空間]]で定義される普通のユークリッド距離とは異なる。 ===定義=== ある集団内の点が多変数ベクトル <math>( x_1, x_2, x_3, \dots, x_p )^{\intercal}</math> で表されるとき、その集団の変数ごとの[[平均値]]を縦ベクトルで <math>\mu = ( \mu_1, \mu_2, \mu_3, \dots , \mu_p )^{\intercal}</math> と表し、集団の[[共分散行列]](各変数間の[[共分散]]を配列した[[行列]])を <math>\Sigma</math> とすれば、ある点<math>x = ( x_1, x_2, x_3, \dots, x_p )^{\intercal}</math> からの集団へのマハラノビス距離は、以下のように定義される: :<math>D_M(x) = \sqrt{(x - \mu)^{\intercal} \Sigma^{-1} (x-\mu)} </math> 平方根の内側は、縦ベクトルの転置と行列と縦ベクトルの積であり、スカラー量(正値二次形式)で正である。 マハラノビス距離はまた、共分散行列が <math>\Sigma</math> で同じ[[確率分布]]に従う2つの[[確率変数]]ベクトル、<math> \vec{x}</math> と <math> \vec{y}</math> の間の隔たりの指標としても定義できる: :<math> d(\vec{x},\vec{y})=\sqrt{(\vec{x}-\vec{y})^{\intercal} \Sigma^{-1} (\vec{x}-\vec{y})}</math> 共分散行列が[[対角行列]]であれば(相異なる変数に相関がないということ)、マハラノビス距離は「正規化ユークリッド距離」と呼ばれる: :<math> d(\vec{x},\vec{y})=\sqrt{\sum_{i=1}^p {(x_i - y_i)^2 \over \sigma_i^2}}</math> ここで <math>\sigma_i</math> は、 <math> x_i</math> の集合における[[標準偏差]]である。さらに共分散行列が[[単位行列]]であれば、マハラノビス距離はユークリッド距離と一致する。 ===直感的解釈=== データを''N''-次元ユークリッド空間の点で表して、これがある集団(与えられた複数の標本点がこれに属すことがすでにわかっている)に属す確率を求めることを考えよう。 まずは標本点の平均あるいは重心を求める。直感的には、目的としている点がその重心に近いほど、その集団に属す確からしさが高い。しかし集団の大きさも知る必要がある。単純な方法としては、重心から各標本点への距離の標準偏差を求める方法がある。標本点と重心との距離が1標準偏差よりも小さければ、標本点がその集団に属す確からしさが高いといえる。距離が遠く離れているほど、点がその集団に分類されない可能性が高くなる。 この直感的な考え方は、点と集団との間の正規化距離を <math> (x - \mu)/\sigma </math> と定義することで定量化できる。これを正規分布に当てはめると、点が集団に属す確率が求められる。この方法の欠点は、標本が重心のまわりに球状に分布していると仮定していることである。分布が球状でないとしたら、確率は重心からの距離だけでなく方向にも依存するだろう。 例えば分布が楕円状だった場合、短軸方向の距離は小さくなければならないが、長軸方向の距離はより大きい値を取りうるだろう。分布を最もよく表現する楕円は、共分散行列によって見積もることが出来る。そして重心から標本点までの距離を、その方向における楕円の幅で割ったものがマハラノビスの距離である。(集団の分布密度が多次元の一般化正規分布関数であることを仮定していることになる) ===てこ比との関係=== マハラノビス距離はてこ比(leverage)''h'' という統計量と密接な関係がある。多変数データ集合の重心から目的とする点までのマハラノビス距離は、その点のてこ比に (''N'' − 1) をかけたものとなる(ここで''N'' はデータ集合の点の数)。 ==応用== ===統計分類への応用=== マハラノビス距離は[[クラスタリング]]などの[[統計分類]]に幅広く使われる。ある点をNクラスの1つに分類するのにマハラノビス距離を利用するには、まず各クラスの共分散行列を(普通はそれに属すことがすでにわかっている標本に基づいて)求める。次に、試験標本が与えられたら、各クラスへのマハラノビス距離を計算する。そしてマハラノビス距離が最小となるようなクラスに属すとして分類を決定する。これは上記の確率的解釈によれば、確率の最高となるクラスを選ぶことに等しい。またマハラノビス距離とてこ比は、[[線形回帰]]モデルを作る際、[[外れ値]]を決定するのによく使われる。他の標本集団からのマハラノビス距離が大きな点は、てこ比が高いという。これは、回帰曲線の勾配などの係数に対する影響が大きいということである。 ===マハラノビス・タグチ・システム=== 品質工学の分野において、マハラノビス距離を[[田口玄一]]が応用した手法として、MTS(マハラノビス・タグチ・システム)、MT法がある。当初はマハラノビス距離をSN比で評価しようという手法を指したが、発展してマハラノビス距離を使用しない手法についてもこの名が使われる場合がある。なお、命名はマハラノビスや田口ではなく、田口玄一自身は直交化を使っているため、マハラノビス・タグチ・シュミット法と呼ばれることを希望している<ref>田口(1999)p.190-200</ref>。 ==脚注== {{Reflist}} ==参考文献== *{{Cite journal|volume=2|issue=1|pages=49-55|first=Prasanta Chandra|last=Mahalanobis|title=On the generalized distance in statistics|journal=Proceedings of the National Institute of Sciences of India|accessdate=2023-9-10|year=1936|url=http://bayes.acs.unt.edu:8083/BayesContent/class/Jon/MiscDocs/1936_Mahalanobis.pdf}} *{{Cite book|和書|title=タグチメソッドわが発想法: なぜ私がアメリカを蘇らせた男なのか|author=田口玄一|publisher=経済界|year=1999|month=11|isbn=4766781937}} *{{Cite book|和書|title=MTシステムにおける技術開発|series=品質工学応用講座|editor=田口玄一、兼高達貮 編|publisher=日本規格協会|year=2002|month=6|isbn=978-4542511149}} *{{Cite journal|和書|author=孫寧、安倍正人、根元義章|title=和書改良型マハラノビス距離を用いた高精度な手書き文字認識|journal=情報処理学会研究報告 グラフィクスとCAD研究会報告|volume=94|number=110|pages=pp.169-176|year=1994|month=12|url=https://cir.nii.ac.jp/crid/1571417127085786624}} *{{Cite journal|和書|author=繁田亜友子、濱本和彦、野須潔|title=英語リスニング電子教材を対象とした眼球運動分析による学習者の主観難易度の推定|journal=東海大学紀要 開発工学部|volume=20|pages=pp.117-125|year=2011|month=3|url=https://cir.nii.ac.jp/crid/1572543026907712512}} ==関連項目== * [[プラサンタ・チャンドラ・マハラノビス]] * [[品質工学]]、[[品質工学#MT法(MTシステム)]] * [[ハミング距離]] ==外部リンク== *フリーソフト [http://www.vector.co.jp/soft/win95/business/se489792.html 統計学:マハラノビスの汎距離の計算]、2014年2月10日閲覧。 *アングルトライ株式会社 [http://www.angletry.com/modules/smartsection/item.php?itemid=14 MTシステム概要]、2014年2月10日閲覧。 {{DEFAULTSORT:まはらのひすきより}} [[Category:統計的距離]] [[Category:距離空間]] [[Category:プラサンタ・チャンドラ・マハラノビス]] [[Category:数学のエポニム]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Lang-en
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
マハラノビス距離
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報