Product Design, Manufacturing & Innovation Resources
» 逻辑回归

逻辑回归

1960
  • David Cox
为医疗和金融应用分析逻辑回归数据的统计学家。.

(图片仅供参考)

针对分类因变量(通常为二进制因变量)的回归模型。它不是直接对结果进行建模,而是使用 logistic(sigmoid)函数对结果的概率进行建模。该模型将事件的对数概率预测为自变量的线性组合:[latex]/ln(\frac{p}{1-p}) = \beta_0 + \beta_1 x_1 + \dots + \beta_p x_p[/latex],其中 p 是事件的概率。.

逻辑回归是二元分类问题的基本算法。它是广义线性模型 (GLM) 的一种,将线性回归的思想扩展到结果变量不是连续的情况。将线性回归直接应用于二元(0/1)结果是有问题的,因为它可能产生逻辑 [0, 1] 范围之外的预测概率,并且违反了误差方差恒定的 OLS 假设。.

逻辑回归通过使用链接函数转换结果来解决这个问题。它将几率的对数或 ‘logit ’作为预测因子的线性函数建模。赔率是成功概率([latex]p[/latex])与失败概率([latex]1-p[/latex])之比。这种转换,[latex]/text{logit}(p) = \ln(p/(1-p))[/latex],将概率从范围 [0, 1] 映射到整个实数线 [latex](-\infty,+\infty)[/latex],使其适合线性模型。.

要返回到概率,可以应用 logit 函数的逆函数,即 logistic 或 sigmoid 函数:[latex]p = \frac{e^{\beta_0 + \beta_1 x_1 + \dots}}{1 + e^{\beta_0 + \beta_1 x_1 + \dots}}[/latex].与线性回归不同,参数([latex]\beta[/latex])不是用最小二乘法估算的。相反,通常使用最大似然估计法(MLE)来找到参数,这是一个迭代过程,可以找到使观察实际数据的可能性最大化的参数值。该模型可通过多项式逻辑回归进行扩展,以处理多类问题。.

UNESCO Nomenclature: 1209
- 统计资料

类型

软件/算法

中断

重大的

用法

广泛使用

前体

  • 线性回归
  • 概率论(伯努利分布)
  • 最大似然估计(由 RA Fisher 开发)
  • Probit 模型(二元结果的早期模型)
  • 广义线性模型的概念

应用程序

  • 医学诊断(例如,根据症状预测疾病的存在)
  • 信用评分和财务风险评估
  • 电子邮件客户端中的垃圾邮件检测
  • 电信和订阅服务中的客户流失预测
  • 选举结果预测

专利:

NA

潜在创新理念

由于机器人流量被拦截(目前每天超过 4 万),此内容仅限社区成员查看。
> 登录 > 或者 > 注册 < (100% 免费)即可访问此内容,以及所有其他受限内容和工具。

相关内容: 逻辑回归、分类、二元结果、sigmoid 函数、log-odds、最大似然估计、机器学习、预测建模、广义线性模型、分类数据。.

历史背景

逻辑回归

1950
1952
1956
1960
1967
1967
1970
1950
1950
1953
1960
1960
1967
1970
1970

(如果日期未知或不相关,例如“流体力学”,则提供其显著出现的近似估计)

相关发明、创新和技术原理

只有注册会员才能免费获得 100% 的全尺寸图片和下载。.

> 登录 <