Product Design, Manufacturing & Innovation Resources
» ロジスティック回帰

ロジスティック回帰

1960
  • David Cox
Statistician analyzing logistic regression data for medical and financial applications.

(画像はイメージです)

カテゴリ変数(通常は二値変数)の回帰モデル。結果を直接モデル化する代わりに、ロジスティック(シグモイド)関数を使用して結果の確率をモデル化します。このモデルは、イベントの対数オッズを独立変数の線形結合として予測します。[latex]ln(frac{p}{1-p}) = beta_0 + beta_1 x_1 + dots + beta_p x_p[/latex]、ここで p はイベントの確率です。

ロジスティック回帰は、二値分類問題における基本的なアルゴリズムです。これは、線形回帰の概念を結果変数が連続的でない場合に拡張した一般化線形モデル(GLM)の一種です。二値(0/1)の結果に線形回帰を直接適用すると、予測確率が論理的な[0, 1]の範囲外になる可能性があり、最小二乗法(OLS)の誤差分散が一定であるという仮定に違反するため、問題が生じます。

ロジスティック回帰は、リンク関数を使用して結果を変換することでこの問題を解決します。これは、オッズの対数、つまり「ロジット」を予測変数の線形関数としてモデル化します。オッズは、成功の確率([latex]p[/latex])と失敗の確率([latex]1-p[/latex])の比です。この変換、[latex]text{logit}(p) = ln(p/(1-p))[/latex]は、確率を範囲[0, 1]から実数全体[latex](-infty, +infty)[/latex]にマッピングし、線形モデルに適したものにします。

確率に戻すには、ロジット関数の逆関数であるロジスティック関数またはシグモイド関数を適用します。[latex]p = frac{e^{beta_0 + beta_1 x_1 + dots}}{1 + e^{beta_0 + beta_1 x_1 + dots}}[/latex]。線形回帰とは異なり、パラメータ([latex]beta[/latex])は最小二乗法で推定されません。代わりに、通常は最尤推定法(MLE)を使用して求められます。これは、実際のデータを観測する尤度を最大化するパラメータ値を見つける反復プロセスです。このモデルは、多項ロジスティック回帰によって多クラス問題を処理するように拡張できます。

UNESCO Nomenclature: 1209
統計

タイプ

ソフトウェア/アルゴリズム

混乱

実質的な

使用法

広く普及している

前駆物質

  • 線形回帰
  • Probability theory (Bernoulli distribution)
  • 最尤推定法(RAフィッシャーによって開発された)
  • プロビットモデル(二値結果を扱う初期のモデル)
  • 一般化線形モデルの概念

アプリケーション

  • 医学的診断(例:症状に基づいて疾患の有無を予測すること)
  • 信用スコアリングと金融リスク評価
  • メールクライアントにおけるスパム検出
  • customer churn prediction in telecommunications and subscription services
  • 選挙結果予測

特許:

NA

潜在的なイノベーションのアイデア

ボットによるトラフィック(現在1日あたり4万件以上)を排除するため、このコンテンツはコミュニティメンバー限定となっています。
> ログイン < または > 登録 < (100%無料)でこれにアクセスできます。他のすべての制限付きコンテンツとツールも同様です。

関連キーワード:ロジスティック回帰、分類、二値結果、シグモイド関数、対数オッズ、最尤推定、機械学習、予測モデリング、一般化線形モデル、カテゴリデータ。

歴史的背景

ロジスティック回帰

1950
1952
1956
1960
1967
1967
1970
1950
1950
1953
1960
1960
1967
1970
1970

(日付が不明または関連性がない場合、例えば「流体力学」などでは、その注目すべき出現時期の概算値が提示されます。)

関連する発明、革新、および技術原理

フルサイズの画像とダウンロードは、登録会員のみが100%無料で利用できます。