ロジスティック回帰のソースを表示
←
ロジスティック回帰
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{回帰分析}} '''ロジスティック回帰'''(ロジスティックかいき、{{lang-en-short|Logistic regression}})は、[[ベルヌーイ分布]]に従う変数の統計的[[回帰分析|回帰]]モデルの一種である。連結関数として[[ロジット]]を使用する[[一般化線形モデル]] (GLM) の一種でもある。[[1958年]]に[[デイヴィッド・コックス]]が発表した<ref>{{cite journal|last1=Cox|first1=DR|title=The regression analysis of binary sequences (with discussion)|journal=J Roy Stat Soc B|date=1958|volume=20|pages=215–242}}</ref>。確率の[[回帰分析|回帰]]であり、[[分類 (統計学)|統計学の分類]]に主に使われる。医学や社会科学でもよく使われる{{要出典|date=2019年5月}}。 モデルは同じく1958年に発表された単純[[パーセプトロン]]と等価であるが、[[scikit-learn]]などでは、パラメータを決める[[最適化問題]]で[[確率的勾配降下法]]を使用する物をパーセプトロンと呼び、[[座標降下法]]や[[準ニュートン法]]などを使用する物をロジスティック回帰と呼んでいる。 == 概要 == ロジスティック回帰モデルは以下のような形式である。x が入力で、pが確率(出力)、αとβがパラメータ。 {{Indent| <math>\operatorname{logit}(p_i)=\ln\left(\frac{p_i}{1-p_i}\right) = \alpha + \beta_1 x_{1,i} + \cdots + \beta_k x_{k,i},</math><br /> <math>i = 1, \dots, n,\,\!</math>}} ここで、''n'' 個のユニットと共変動 ''X'' があり、以下のような関係にある。 {{Indent|<math>p_i = E(Y|X_i) = \Pr(Y_i = 1).\,\!</math>}} 結果の[[オッズ]](1から確率を引いたもので確率を割った値)の対数は、説明変数 ''X<sub>i</sub>'' の線形関数としてモデル化される。これを次のようにも表せる。 {{Indent|<math>p_i = \Pr(Y_i = 1|X) = \frac{1}{1+e^{-(\alpha + \beta_1 x_{1,i} + \cdots + \beta_k x_{k,i})}}</math>}} 単純パーセプトロンの記法を使うと上記の式は以下のようにも表現できる。<math>\varsigma_1</math> は標準[[シグモイド関数]]。 {{Indent|<math>p_i = \varsigma_1 (\alpha + \beta_1 x_{1,i} + \cdots + \beta_k x_{k,i})</math>}} パラメータの推定は[[オッズ比]]に重大な影響がある。性別のような2値の説明変数の場合、<math>e^\beta</math> は例えば男性と女性の結果の[[オッズ比]]の推定である。推定には[[最尤法]]を使うことが多い。 このモデルの拡張として多分割(polytomous)ロジスティック回帰がある。複数カテゴリの従属変数や順序のある従属変数を扱う。ロジスティック回帰による階層分けを[[多項ロジット]]モデルと呼ぶ。 == 応用 == 社会科学分野での典型的な応用として、企業の過去のデータをもとに[[信用リスク]]を推定するという用法がある。 2値ロジスティック回帰は[[ダイレクトマーケティング]]でよく使われ、ある提案に反応する人々を特定するのに使われる(従属変数は「反応する=1」と「反応しない=0」である)。ダイレクトマーケティングの2値ロジスティック回帰モデルは「リフトチャート」を使って評価される。これは、過去のメールへの反応のデータとモデルによる予測結果を比較する。 == 例 == ロジスティック回帰モデルは[[一般化線形モデル]]の一種である。''p''(''x'') が、予測値変数 ''x'' について成功の確率を表すとすると、次のように表される。 {{Indent|<math>p(x) = \frac{e^{B_0 + B_1x}}{1+e^{B_0+B_1x}}.</math>}} 代数的操作を施すと次のようになる。 {{Indent|<math>\frac{p(x)}{1-p(x)} = e^{B_0+B_1x},</math>}} ここで、<math>\frac{p(x)}{1-p(x)}</math> は成功の[[オッズ]]である。ここで、例えば ''p''(50) が 2/3 となる場合であるとして計算してみると {{Indent|<math>\frac{p(50)}{1-p(50)} = \frac{\frac{2}{3}}{1-\frac{2}{3}} = 2.</math>}} したがって、''x'' = 50 のとき、成功の可能性は失敗の2倍(オッズが 2 対 1 )である。 == 脚注 == {{脚注ヘルプ}} {{reflist}} == 参考文献 == {{参照方法|section=1|date=2018年12月25日 (火) 02:53 (UTC)}} * Agresti, Alan, ''Categorical Data Analysis'', 2nd ed., New York: Wiley-Interscience, 2002, ISBN 0-471-36093-7. * Amemiya, T., ''Advanced Econometrics'', Harvard University Press, 1985, ISBN 0-674-00560-0. * Balakrishnan, N., ''Handbook of the Logistic Distribution'', Marcel Dekker Inc., 1991, ISBN 0824785878. * Green, William H., ''Econometric Analysis'', fifth edition, Prentice Hall, 2003, ISBN 0-13-066189-9. * Hosmer, David W. and Stanley Lemeshow, ''Applied Logistic Regression'', 2nd ed., New York; Chichester, Wiley, 2000, ISBN 0-471-35632-8. == 関連項目 == * [[ニューラルネットワーク]] * [[データマイニング]] * [[判別分析]] * [[パーセプトロン]] * [[線形分類器]] == 外部リンク == * [http://statpages.org/logistic.html Web-based logistic regression calculator] * [http://koko15.hus.osaka-u.ac.jp/~torii/logistic-a/index.htm 「ロジスティック回帰分析」入門] 鳥居稔(大阪大学) {{統計学}} {{Normdaten}} {{DEFAULTSORT:ろしすていつくかいき}} [[Category:ロジスティック回帰|*]] [[Category:統計学的分類]] [[Category:計量経済学]] [[Category:最適化]] [[Category:統計検定]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Indent
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:参照方法
(
ソースを閲覧
)
テンプレート:回帰分析
(
ソースを閲覧
)
テンプレート:統計学
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
テンプレート:要出典
(
ソースを閲覧
)
ロジスティック回帰
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報