ジップの法則

ジップの法則(ジップのほうそく、テンプレート:Lang)あるいはジフの法則とは、出現頻度が テンプレート:Mvar 番目に大きい要素が、1位のものの頻度と比較して テンプレート:Math に比例するという経験則である。テンプレート:Lang は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。
包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はテンプレート:仮リンクの特殊な形である。
この法則はアメリカの言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究としてテンプレート:仮リンク、テンプレート:仮リンクなどの研究があり、ジップ自身もそのことを1942年の論文で紹介した[1]。
法則が成立する現象の例
次のような様々な現象(自然現象、社会現象など)に成り立つ場合があることが確認されている:
- 単語の出現頻度:言語全体だけでなく、例えば「ハムレット」など1作品中でも成り立つことが示されている。
- ウェブページへのアクセス頻度
- 都市の人口(都市の順位・規模法則)
- 上位3%の人々の収入
- 音楽における音符の使用頻度
- 細胞内での遺伝子の発現量
- 地震の規模
- 固体が割れたときの破片の大きさ
論理的な定義
一般のジップの法則は
(ただし テンプレート:Mvar は全要素の数、テンプレート:Mvar は順位)と書き表される。
ここで元来のジップの法則では テンプレート:Math である。このとき テンプレート:Mvar を無限大にすると分母は収束しない(無限大に発散する、「調和級数」を参照)ため、元来のジップの法則では テンプレート:Mvar を有限としなければならない(現実にもそう考えられる場合が多い)。
ただし テンプレート:Mvar が1より少しでも大きい実数ならば、テンプレート:Mvar を無限大にしても分母は収束し(ゼータ関数 テンプレート:Math に等しい)、テンプレート:Mvar の値を無限にとりうる分布関数とすることができる。
関連する概念
ジップの法則は冪乗則 (テンプレート:Lang) の一種である。また、ジップ分布は変数変換によりパレート分布(連続分布)と同じ形になることが示されている。パレート分布の離散型である。パレートの法則はパレート分布の特別な場合に当たり、また80-20の法則とも関係がある。順位規模の法則とも呼ばれる。