識別不能

提供: testwiki
2020年1月8日 (水) 06:23時点におけるimported>Nnhによる版 (情報論的識別不能)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

識別不能(しきべつふのう)とは、二つの確率変数を見分けることができないことを意味する。ただ、これらを「見分けようとする人」がどのようにして見分けるのか、どれだけの能力を持っているかによって、見分けられるか・見分けられないかは異なる。そのため、想定する「見分けるために使う能力」により、三つの定義がある。

情報論的識別不能

{Xk}kN,{Yk}kN確率変数とする。

あるk0があって任意のk>k0に対しXkの従う確率分布Ykの従う確率分布が同一である時、族{Xk}kN{Yk}kN情報論的識別不能であるという。

二つの確率変数(の確率分布)が同一であれば、どんなに計算能力があろうとも見分けることができない。つまり、情報論的識別不能は、「どんなに計算能力があろうとも」見分けることができないことを意味する。

例:

  • 確率変数Xk公正なコインk回ふる、という実験の結果。コインの表が出たら1、裏が出たら0、として、k個の0,1列で表現する。
  • 確率変数Yk :公正な2つのコインをk回ふって、各回に同じ面が出るか、という実験の結果。2つのコインで同じ面が出たら1、異なる面が出たら0、としてk個の0,1列で表現する。

XkYkは異なる実験によって得られる確率変数であるが、共に、任意のkビット列が確率1/2kで生じる。よって、X={Xk}kY={Yk}kは情報論的識別不能である。

統計的識別不能

ABを確率変数とする。 ABとの統計的距離x{0,1}k|Pr(A=x)Pr(B=x)| により定義する。 XkYkとの統計的距離が、kに対して無視できるとき、 すなわち任意の多項式Pに対し、あるk0があって任意のk>k0に対し、x{0,1}k|Pr(Xk=x)Pr(Yk=x)|<1/P(k)となる時、族{Xk}kN{Yk}kN統計的識別不能であるという。

二つの確率変数を見分けたい人が、いずれかの確率変数(の確率分布)によって選ばれた値を次々に観測し続けて、見分けることを考えよう。二つの確率分布が大きく異なる場合、観測値の頻度分布を求めることで、どちらの確率分布であるのかを見分けることができるだろう。逆に、確率分布がほとんど同じ場合、多くの値を観測したとしても見分けはつきにくい。統計的識別不可能は、多項式個の値を観測しても見分けがつかないことを意味する。

例:

  • 確率変数Xk :公正なコインをk回ふる、という実験の結果。コインの表が出たら1、裏が出たら0、として、k個の0,1列で表現する。
  • 確率変数ZkXkと同じ実験をするが、k回続けて裏が出たら、最初からやり直すという実験の結果。

Zkでは、0がk個並んだものは生じず(Pr[Zk=0000...0]=0)、それ以外のkビット列が確率1/(2k1)で生じる。よって、XkYkの統計的距離は(2k1)×|1/2k1/(2k1)|+|1/2k0|=1/2k1である。 よって、X={Xk}kZ={Zk}kは統計的識別不能である。

計算量的識別不能

任意の多項式時間機械D識別機(distinguisher)という)と任意の多項式Pに対し、あるk0があって任意のk>k0に対し |Pr(D(Xk)=1)Pr(D(Yk)=1)|<1/P(k)となる時、{Xk}kN{Yk}kN計算量的識別不能であるという。

定義からわかるように、計算量的識別不能は、計算能力を多項式時間に限定した場合に、見分けることができないことを意味する。

例: 暗号理論の分野では、多くの計算量的識別不能を仮定している。例として以下のものがある.


関連項目