二乗平均平方根誤差のソースを表示
←
二乗平均平方根誤差
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{for|バイオインフォマティクスの概念|原子位置の二乗平均平方根偏差}} '''二乗平均平方根誤差'''(にじょうへいきんへいほうこんごさ)は、モデルまたは[[推定量]]により予測された値(標本値または母集団値)と観測された値の間の差として頻繁に使用される尺度である。'''RMSE''' (root-mean-square errorの略)または'''RMSD''' (root-mean-square deviationの略) などとも書かれる。RMSDは、予測値と観測値の差の2次の標本[[モーメント (数学)|モーメント]]の平方根、すなわちこれらの差の[[二乗平均平方根]]を表している。これらの[[偏差]]は、推定に使用されたデータ標本で計算された場合は[[残差]]と呼ばれ標本でなく計算された場合は[[誤差]](または予測誤差)と呼ばれる。RMSDは、様々なデータ点の予測における誤差の大きさを予測力の1つの尺度に集約する役割をする。RMSDは、スケールに依存するため、データセット間ではなく特定のデータセットに対する異なるモデルの予測誤差を比較するための[[正確度と精度|正確度]]の尺度である<ref>{{cite journal|last=Hyndman|first=Rob J.|last2=Koehler|first2=Anne B.|title=Another look at measures of forecast accuracy|journal=International Journal of Forecasting|year=2006|pages=679–688|doi=10.1016/j.ijforecast.2006.03.001|volume=22|issue=4|citeseerx=10.1.1.154.9771}}</ref>。 RMSDは常に非負の値をとり、(ほとんど起こらないが)0はデータに完全にフィットしていることを示す。一般的にはRMSDが小さい方が良いとされている。しかし、この尺度は使用する数値の尺度に依存するため、異なる種類のデータ間での比較は意味を持たない。 RMSDは、[[平均二乗誤差]]の平方根である。各誤差がRMSDに与える影響は二乗誤差の大きさに比例するため、誤差が大きいほどRMSDへの影響も比例して大きくなる。そのため、誤差が大きいほどRMSDへの影響が大きく、結果として外れ値の影響を受けやすくなる<ref name=":0">{{Cite journal|last=Pontius|first=Robert|last2=Thontteh|first2=Olufunmilayo|last3=Chen|first3=Hao|date=2008|title=Components of information for multiple resolution comparison between maps that share a real variable|journal=Environmental Ecological Statistics|volume=15|issue=2|pages=111–142|doi=10.1007/s10651-007-0043-y}}</ref><ref>{{Cite journal|last=Willmott|first=Cort|last2=Matsuura|first2=Kenji|date=2006|title=On the use of dimensioned measures of error to evaluate the performance of spatial interpolators|journal=International Journal of Geographical Information Science|volume=20|pages=89–102|doi=10.1080/13658810500286976}}</ref>。 == 式 == 推定パラメータ <math>\theta</math> に対する[[推定量]] <math>\hat{\theta}</math> に対するRMSDは、[[平均二乗誤差]] (MSE) の平方根として定義される。 :<math>\operatorname{RMSD}(\hat{\theta}) = \sqrt{\operatorname{MSE}(\hat{\theta})} = \sqrt{\operatorname{E}((\hat{\theta}-\theta)^2)}.</math> [[不偏推定量]]の場合、RMSDは分散の平方根であり[[標準偏差]]と呼ばれる。 T回観測された変数を持つ[[回帰分析|回帰]]の[[従属変数]] <math>y_t,</math> の時間 ''t'' に対する予測値 <math>\hat y_t</math> のRMSDは、T個の異なる予測に対して、偏差の二乗の平均の平方根として計算される。 :<math>\operatorname{RMSD}=\sqrt{\frac{\sum_{t=1}^T (\hat y_t - y_t)^2}{T}}.</math> ({{仮リンク|横断データ|en|cross-sectional data}}の回帰では、添え字の ''t'' を ''i'' に、''T'' を ''n'' を置き換える) 分野によっては、RMSDは、変化する可能性がありどちらも「標準」として受け入れられない2つのものの間の差を比較するために使用される。例えば、2つの時系列 <math>x_{1,t}</math> と <math>x_{2,t}</math> の平均的な差を測定する場合、式は次のようになる。 :<math>\operatorname{RMSD}= \sqrt{\frac{\sum_{t=1}^T (x_{1,t} - x_{2,t})^2}{T}}.</math> ==正規化== RMSDを正規化することで、スケールの異なるデータセットやモデル間での比較が容易になる。正規化の方法は文献により統一されていないが、一般的には測定データの平均値または範囲(最大値から最小を引いたもの)が選択される<ref>{{cite web|title=Coastal Inlets Research Program (CIRP) Wiki - Statistics|url=http://cirpwiki.info/wiki/Statistics#Normalization|access-date=4 February 2015}}</ref>。 :<math>\mathrm{NRMSD} = \frac{\mathrm{RMSD}}{y_\max -y_\min}</math> または <math> \mathrm{NRMSD} = \frac {\mathrm{RMSD}}{\bar y} </math>. この値は一般的にNRMSD (normalized root-mean-square deviation) または NRMSE (normalized root-mean-square error) と呼ばれ、多くの場合パーセンテージで表され、値が低いほど残差分散が少ないことを示す。多くの場合、少ない標本では標本範囲が標本の大きさに影響され、比較の妨げになると思われる。 RMSDをより有用な比較尺度とするための別の方法として、RMSDを{{仮リンク|四分位範囲|en|Interquartile range}} (IQR)で分けることが考えられる。RMSDをIQRで分けると、正規化された値は対照となる変数の極端な値に対する感度が低くなる。 :<math>\mathrm{RMSDIQR} = \frac{\mathrm{RMSD}}{IQR}</math> (ここで <math>IQR = Q_3 - Q_1</math>) <math>Q_1 = \text{CDF}^{-1}(0.25)</math> であり <math>Q_3 = \text{CDF}^{-1}(0.75) </math> である。CDF<sup>−1</sup>は{{仮リンク|分位点関数|en|quantile function}}である。 測定値の平均値で正規化する場合、曖昧さを避けるためにRMSDの変動係数(''coefficient of variation of the RMSD, CV(RMSD)'') という用語を使用することがある<ref>{{cite web|title=FAQ: What is the coefficient of variation?|url=https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-is-the-coefficient-of-variation/|access-date=19 February 2019}}</ref>。これは、[[標準偏差]]の代わりにRMSDを用いた[[変動係数]]に類似する。 :<math> \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .</math> == 平均絶対誤差 == 研究者の中にはRMSDの代わりに{{仮リンク|平均絶対誤差|en|Mean absolute error}} (MAE)を使用することを推奨している。MAEはRMSDよりも説明力があるという利点がある。MAEは、誤差の絶対値の平均値である。WAEは、二乗誤差の平均値の平方根よりも基本的に理解しやすい。さらに、各誤差は誤差の絶対値に比例してMAEに影響を与えるが、RMSDの場合はそうではない<ref name=":0" />。 ==使用例== *[[気象学]]において、[[大気]]の挙動を予測する[[数学]]的モデルの効果を確認するために使用される。 *[[バイオインフォマティクス]]において、[[原子位置の二乗平均平方根偏差]]は重ね合わせた[[タンパク質]]の原子間の平均距離の尺度である。 *構造に基づく[[医薬品設計]]では、RMSDはリガンドの結晶コンフォメーションと[[ドッキング (分子)|ドッキング]]予測との間の差を示す尺度である。 *[[経済学]]において、RMSDは経済モデルが[[経済指標]]に適合しているか否かを決定するために使用される。専門家の中には、RMSDは相対絶対誤差よりも信頼性が低いと主張する者もいる<ref>{{cite journal|url= http://faculty.weatherhead.case.edu/Fred-Collopy/researchArticles/ErrorMeasures.pdf | title = Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons |last=Armstrong |first=J. Scott |last2=Collopy |first2=Fred |journal = International Journal of Forecasting | volume = 8 | pages = 69–80 | year = 1992 | doi=10.1016/0169-2070(92)90008-w | issue=1| citeseerx = 10.1.1.423.508 }}</ref>。 *[[実験心理学]]において、RMSDは行動に関する数学または計算モデルが経験的に観察された行動をどの程度説明できるかを評価するために使用される。 *[[地理情報システム]]において、RMSDは空間分析やリモートセンシングの精度を評価するための指標の1つである。 *[[水文地質学]]において、RMSDとNRMSDは、地下水モデルのキャリブレーションを評価するために使用される<ref>{{cite book |title=Applied Groundwater Modeling: Simulation of Flow and Advective Transport |publisher=Academic Press |year=1992 |last=Anderson |first=M.P. |author2=Woessner, W.W. |edition=2nd}}</ref>。 *[[イメージングサイエンス]]において、RMSDは[[ピーク信号対雑音比]]の一部であり、画像を再構成する方法が元の画像に対してどの程度優れているかを評価するために使用される指標である。 *[[計算論的神経科学]]において、RMSDはシステムが与えられたモデルをどれだけうまく学習できるかを評価するために使用される<ref>[http://www.ocgy.ubc.ca/projects/clim.pred/NN/3.1/model.html Ensemble Neural Network Model<!-- Bot generated title -->]</ref>。 *{{仮リンク|タンパク質の核磁気共鳴分光法|en|Nuclear magnetic resonance spectroscopy of proteins}}において、RMSDは得られた構造の束の質を評価する尺度として使用される。 *[[:en:Netflix Prize|Netflix Prize]]の応募作品は、テストデータセットの非公開の「真値」からのRMSDを使用して審査された。 *建物のエネルギー消費量のシミュレーションでは、RMSEとCV(RMSE)は建物の実測値に対してモデルを較正するために使用される<ref>[http://www.bpi.org/Web%20Download/BPI%20Standards/BPI-2400-S-2012_Standard_Practice_for_Standardized_Qualification_of_Whole-House%20Energy%20Savings_9-28-12_sg.pdf ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History]</ref>。 *[[X線結晶構造解析]]において、RMSD(およびRMSZ)は、分子内部の座標が制限付きライブラリ値からどれだけ乖離しているかを測定するために使用される。 ==関連項目== *[[二乗平均平方根]] *[[:en:Mean absolute error]] *[[:en:Average absolute deviation]] *[[:en:Mean signed deviation]] *[[:en:Mean squared deviation]] *[[:en:Squared deviations]] *[[誤差]] ==出典== <references/> {{DEFAULTSORT:にしようへいきんへいほうこんこさ}} [[Category:推定理論]] [[Category:統計的偏差と分散]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Cite web
(
ソースを閲覧
)
テンプレート:For
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
二乗平均平方根誤差
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報