統計学および機械学習の評価指標

テンプレート:Pathnav テンプレート:機械学習 統計学および機械学習の評価指標（とうけいがくおよびきかいがくしゅうのひょうかしひょう）では統計学および（教師ありの）機械学習の評価指標について述べる。

回帰に対する評価指標

以下のものがある^[1]^[2]^[3]。観測値を $y = {y_{1}, y_{2}, \dots, y_{N}}$ 、推定値を $\hat{y_{i}} = {\hat{y_{1}}, \hat{y_{2}}, \dots, \hat{y_{N}}}$ と表す。これらの評価指標は代表的なPythonのオープンソース機械学習ライブラリscikit-learnではmetricsモジュールに実装されており、評価指標を計算する関数を併記する。


略称	名称（英語）	名称（日本語）	定義	scikit-learnのmetricsモジュールでの関数
MSE	Mean Squared Error	平均二乗誤差	$\frac{1}{N} \sum_{i = 1}^{N} (y_{i} - \hat{y_{i}})^{2}$	mean_squared_error(y_true,y_pred)
RMSE	Root Mean Squared Error	二乗平均平方根誤差	$\sqrt{\frac{1}{N} \sum_{i = 1}^{N} (y_{i} - \hat{y_{i}})^{2}}$	np.root(mean_squared_error(y_true,y_pred))
MAE	Mean Absolute Error	平均絶対誤差	$\frac{1}{N} \sum_{i = 1}^{N} \| y_{i} - \hat{y_{i}} \|$	mean_absolute_error(y_true,y_pred)
MAPE	Mean Absolute Percentage Error	平均絶対誤差率	$\frac{1}{N} \sum_{i = 1}^{N} \frac{\| y_{i} - \hat{y_{i}} \|}{y_{i}}$
RMSPE	Root Mean Squared Percentage Error	平均二乗パーセント誤差の平方根	$\sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(\frac{y_{i} - \hat{y_{i}}}{y_{i}})}^{2}}$
RMSLE	Root Mean Squared Logarithmic Error		$\sqrt{\frac{1}{N} \sum_{i = 1}^{N} (\log (y_{i} + 1) - \log (\hat{y_{i}} + 1))^{2}}$	mean_squared_log_error(y_true,y_pred)
$R^{2}$	coefficient of determination	決定係数	$1 - \frac{\sum_{i = 1}^{N} (y_{i} - \hat{y_{i}})^{2}}{\sum_{i = 1}^{N} (y_{i} - \bar{y})^{2}}$ 、ここで $\bar{y} = \frac{1}{N} \sum_{i = 1}^{N} y_{i}$	r2_score(y_true,y_pred)

ただし、決定係数は上に挙げたものの他に7種類の定義が知られている。テンプレート:詳細記事

二値分類

混同行列

テンプレート:Main

		実際の値
		正	負
予測値	正	真陽性 True Positive(TP)	偽陽性 False Positive(FP)
	負	偽陰性 False Negative(FN)	真陰性 True Negative(TN)

scikit-learnではmetricsモジュールの「confusion_matrix(y_true, y_pred)」。

各種指標

以下のものがある^[4]^[5]^[6]^[7]^[8]：

			実際の値
			総数		割合
			正	負	正	負
予測値	総数	正	真陽性 True Positive(TP)	偽陽性 False Positive(FP) 第一種の過誤	陽性適中率(Positive Prediction Value、PPV) 適合率(Precision) $\frac{T P}{T P + F P}$	テンプレート:仮リンク(False Discovery Rate、FDR) $\frac{F P}{T P + F P}$
	総数	負	偽陰性 False Negative(FN) 第二種の過誤	真陰性 True Negative(TN)	False Omission Rate (FOR) $\frac{F N}{F N + T N}$	陰性適中率(Negative Predictive Value 、NPV) $\frac{T N}{F N + T N}$
	割合	正	真陽性率(True Positive Rate 、TPR)、再現率(Recall)、感度(Sensitivity)、Hit Rate $\frac{T P}{T P + F N}$	偽陽性率(False Positive Rate 、FPR)、 Fall-out $\frac{F P}{F P + T N}$
	割合	負	偽陰性率(False Negative Rate、FNR)、Miss Rate $\frac{F N}{T P + F N}$	真陰性率(True Negative Rate 、TNR)、特異性(Specificity)、 Selectivity $\frac{T N}{F P + T N}$

scikit-learnではmetricsモジュールの下記の関数を呼び出すことで計算可能：

適合率：precision_score(y_true, y_pred)
再現率：recall_score(y_true, y_pred)


名称	名称（英語）	定義	直観的意味、備考	scikit-learnのmetricsモジュールでの関数
検査前確率	Pre-test Probability	$\frac{T P + F N}{T P + F N + F P + F N}$	全データにおける正例の割合。医学では「有病割合」(Prevalence)とも呼ばれる
精度	Accuracy	$\frac{T P + T N}{T P + T N + F P + F N}$	予測が正解したものの割合。「正解率」とも呼ばれる。	accuracy_score(y_true, y_pred)
誤分類率	classification error rate	$1 - A c c u r a c y$
	balanced accuracy (BA)	$\frac{T P R + T N R}{2}$
スレットスコア	Threat score(TS)	$\frac{T P}{T P + F N + F P}$	「重要成功指数」(Critical Success Index、CSI)とも呼ばれる。精度の分母からTNを削ったもの。正例に比べ負例が極端多い場合、TNは大きな値になるため精度よりも有効な指標となる。
テンプレート:Math値	テンプレート:Math-rate	$\frac{1 + β^{2}}{\frac{β^{2}}{r e c a l l} + \frac{1}{p r e c i s i o n}} = \frac{(1 + β^{2}) r e c a l l \cdot p r e s i c i o n}{r e c a l l + β^{2} p r e s i c i o n}$	適合率と再現率の重み付き調和平均。特にテンプレート:Mathのケースであるテンプレート:Math値がよく使われる。 $F_{1} = \frac{T P}{T P + \frac{F P + F N}{2}}$ であり、分母にTNがないので、スレットスコアと同様、正例に比べ負例が極端多い場合、有効な指標となる。	fbeta_score() f1_score()
	Markedness (MK)	$P P V + N P V - 1$	「deltaP」とも呼ばれる
	Bookmaker Informedness (BM)	$T P R + T N R - 1$	単に「Informedness」とも呼ばれる。「deltaP'」とも呼ばれる。
-	マシューズ相関係数(Matthews Correlation Coefficient 、MCC)	$\frac{T P \cdot T N - F P \cdot F N}{\sqrt{(T P + F P) (T P + F N) (T N + F P) (T N + F N)}}$	不均衡なデータに対しても性能を適切に評価できる指標。	matthews_corrcoef()
-	Fowlkes–Mallows index(FM)	$\sqrt{\frac{T P}{T P + F P} \cdot \frac{T P}{T P + F N}} = \sqrt{P P V \cdot T P R}$
-	Prevalence Threshold (PT)	$\frac{\sqrt{T P R (- T N R + 1)} + T N R - 1}{(T P R + T N R - 1)}$
陽性尤度比	Positive likelihood ratio(LR+)	$\frac{F P R}{T P R}$	LR+= $\frac{T P / F P}{(T P + F N) / (F P + T N)}$ =検査後オッズ/検査前オッズが成立する。
陰性尤度比	Negative likelihood ratio(LR−)	$\frac{F N R}{T N R}$
テンプレート:仮リンク	Diagnostic odds ratio(DOR)	$\frac{L R +}{L R -}$
交差エントロピー	cross entropy	$- \frac{1}{N} \sum_{i}^{N} y_{i} \log p_{i} + (1 - y_{i}) \log (1 - p_{i})$	log損失(log loss)とも。テンプレート:Mvarはテンプレート:Mvar番目のデータが正例なら1、負例なら0、テンプレート:Mvarは予測器が正例だと予測した確信度∈[0,1]。	log_loss()

脚注

テンプレート:脚注ヘルプテンプレート:Reflist

[1] テンプレート:Cite web

[2] テンプレート:Cite web

[3] テンプレート:Cite book

[Fawcett2006-4] テンプレート:Cite journal

[Powers2011-5] テンプレート:Cite journal

[ting2011precision-6] テンプレート:Cite book

[cawcr-7] テンプレート:Cite web

[ChiccoJurman2020-8] テンプレート:Cite journal

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

統計学および機械学習の評価指標

目次

回帰に対する評価指標

二値分類

混同行列

各種指標

脚注

ナビゲーションメニュー

統計学および機械学習の評価指標

回帰に対する評価指標

二値分類

混同行列

各種指標

脚注

ナビゲーション メニュー

検索

ナビゲーションメニュー