ポアソン分布
テンプレート:出典の明記 テンプレート:確率分布 統計学および確率論で用いられるポアソン分布(テンプレート:Lang-en-short)とは、ある事象が一定の時間内に発生する回数を表す離散確率分布である。
数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した。
ある離散的な事象について、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起間隔の確率を示す[1]。
定義
定数 テンプレート:Math に対し、テンプレート:Math 以上の整数を値にとる確率変数 テンプレート:Mvar が
を満たすとき、確率変数 テンプレート:Mvar は母数 テンプレート:Mvar のポアソン分布に従うという。
ここで、テンプレート:Mvar はネイピア数 (テンプレート:Math)であり、テンプレート:Math は テンプレート:Mvar の階乗を表す。また、テンプレート:Mvar は所与の区間内で発生する事象の期待発生回数に等しい。
テンプレート:Math は、「所与の時間中に平均で テンプレート:Mvar 回発生する事象がちょうど テンプレート:Mvar 回(テンプレート:Mvar は非負の整数)発生する確率」に相当する。例えば、事象が平均で10分間に5回発生する場合、10分間の中で事象が発生する回数は、テンプレート:Math のポアソン分布モデルを使って求められる。
性質
平均・分散
ポアソン分布の平均 テンプレート:Math および分散 テンプレート:Math は、テンプレート:Mvar に等しい[2]。
最頻値
ポアソン分布の最頻値は、テンプレート:Mvar 以下で最大の整数である。
積率母関数
平均 テンプレート:Mvar のポアソン分布の積率母関数 テンプレート:Math は、
で与えられる。
モーメント
ポアソン分布の高次モーメントは、テンプレート:Mvar を含むトゥシャール多項式であり、二項係数を持つ。
ポアソン分布の テンプレート:Mvar 次のテンプレート:Illは テンプレート:Mvar である。
キュムラント
ポアソン分布の テンプレート:Mvar 次のキュムラント テンプレート:Mvar は全て、平均 テンプレート:Mvar と等しい。
再生性
ポアソン分布は再生性をもつ。すなわち、テンプレート:Mvar と テンプレート:Mvar とが独立な確率変数であり、それぞれパラメータ テンプレート:Mvar, テンプレート:Mvar のポアソン分布に従うとき、 確率変数の和 テンプレート:Math はパラメータ テンプレート:Math のポアソン分布に従う。
その他
ポアソン分布は無限分解可能な確率分布である。
近似
テンプレート:Mvar が十分に大きい(たとえば テンプレート:Math)ならば、平均 テンプレート:Mvar、標準偏差 テンプレート:Math の正規分布はこのポアソン分布の非常によい近似となる。おおよそ テンプレート:Math であれば、適切な連続な分布への修正がなされている場合に限り、正規分布はこのポアソン分布のよい近似となる。例えば テンプレート:Math に関して、テンプレート:Mvar が非負の整数ならば、テンプレート:Math と置換することができる。
ポアソン過程
テンプレート:Mvar は、単位時間あたりの事象の平均発生回数などの割合と見なされる場合があり、到着率と呼ばれる。このとき、テンプレート:Mvar を時刻 テンプレート:Mvar より前に発生した事象の回数とすると、
となる。この式を満たす確率過程をポアソン過程という。さらに、最初の事象が発生するまでの待機時間 テンプレート:Mvar は、指数分布による連続確率変数である。この確率分布は、次のように導くことができる。
時間を含む場合、すなわち1次元ポアソン過程では、各時間内で事象が発生する回数を確率変数とする離散ポアソン分布と、待機時間を確率変数とする連続アーラン分布の両方を含んでいる。1よりも高い次元のポアソン過程についても同様である。
事象
- 具体的な例
ポアソン分布は、テンプレート:Illに関連して発生する。 これは、離散的な自然現象(所与の領域内や所与の時間内において、0回、1回、2回、3回… と発生する現象)に該当するものであり、現象が発生する確率は、時間ないし空間内において一定である。また、時間または空間における発生間隔は指数分布になる。次に、その例を示す。
- 1時間に特定の交差点を通過する車両の台数。
- 1ミリリットルの希釈された水試料中に含まれる特定の細菌の数[3](細菌数検査における最確法)。
- 単位面積あたりの雨粒の数。
- 1ページの文章を入力するとき、綴りを間違える回数。
- 1日に受け取る電子メールの件数。
- 1時間あたりの電話がかかってくる件数。
- ある一定の時間内の店への来客数。
- 1分間のWebサーバへのアクセス数。
- 1キロメートルあたりのある通り沿いのレストランの軒数。
- 1ヘクタールあたりのエゾマツの本数。
- 1立方光年あたりの恒星の数。
- 単位時間あたりの放射線の計数値であるカウント毎分やカウント毎秒(半減期による減衰や外部からの放射能などによる変動がないと仮定して)。
- 歴史的例
上記の例のほか、歴史的に有名な事例としては、ロシア生まれでドイツで活躍した経済学者、統計学者のテンプレート:仮リンク テンプレート:Ru による「プロイセン陸軍で馬に蹴られて死亡した兵士数」の例が知られている。ボルトケヴィッチは著書 テンプレート:Lang テンプレート:Lang[4]において、プロイセン陸軍の14の騎兵連隊の中で、1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数について調査しており、1年間当たりに換算した当該事案の発生件数の分布が母数 テンプレート:Math のポアソン分布によく従うことを示している。
- 事象の特徴
上記のように、稀にしか起こらないような現象を大量に観測した結果がポアソン分布に従う例は極めて多く見られる。このようなポアソン分布に従う事象の中で、時間の経過とともに発生する事象の特徴は次のようにまとめられる。
- (希少性):時間幅 テンプレート:Math の間に着目している事象がちょうど1回起こる確率が テンプレート:Math、2回以上起こる確率が テンプレート:Math
- (定常性):事象の起きる確率は、どの時間帯で同じ
- (独立性):事象の起きる確率は、それ以前に起こった事象の回数や起こり方には無関係
ここで、テンプレート:Math は テンプレート:Math に対して高位の無限小を表しており、テンプレート:Math のスケールに注目したときに無視できる微小量であることを表す。
極限定理
パラメータが テンプレート:Mvar と テンプレート:Math である二項分布において、テンプレート:Mvar を一定に保ったまま テンプレート:Mvar を無限大に近づけると、その分布は平均 テンプレート:Mvar のポアソン分布に近づく。すなわち、
が成り立つ。これをポアソンの極限定理という。この定理の名は、数学者シメオン・ドニ・ポアソンが1837年に著書 テンプレート:Lang テンプレート:Lang[5]の中で結果を与えたことに由来する。なお、この中で、二項分布の極限としてポアソン分布が初めて導出されている。
導出の詳細を次に示す。計算には、以下の関係式を用いる。
ここで テンプレート:Math とすると、
テンプレート:Mvar を無限大に近づけると、4つの下波括弧のうち、最初の下波括弧の部分は テンプレート:Math に近づく。2番目の下波括弧の部分には テンプレート:Mvar が出現しないので、そのままである。3番目の下波括弧の部分は テンプレート:Math に近づく。最後の下波括弧の部分は テンプレート:Math に近づく。
したがって極限は存在し、
となる。
少数の法則
法則という言葉は、確率分布の同義語として使われることがあり、法則収束は分布の収束を意味する。したがってポアソン分布は、滅多に起こり得ない希少な事象の発生数の確率分布であることから、少数の法則と呼ばれることがある。
脚注
関連項目
外部リンク
テンプレート:Normdaten テンプレート:確率分布の一覧
- ↑ テンプレート:Cite web
- ↑ テンプレート:Cite report ポアソン分布の平均と分散の導出
- ↑ テンプレート:Cite journal
- ↑ テンプレート:Cite 復刻版が2010年にNabu Pressより発売されている
- ↑ テンプレート:Cite