Product Design, Manufacturing & Innovation Resources

家 » 逻辑回归

逻辑回归

1960

David Cox

（图片仅供参考）

针对分类因变量（通常为二进制因变量）的回归模型。它不是直接对结果进行建模，而是使用 logistic（sigmoid）函数对结果的概率进行建模。该模型将事件的对数概率预测为自变量的线性组合：[latex]/ln(\frac{p}{1-p}) = \beta_0 + \beta_1 x_1 + \dots + \beta_p x_p[/latex]，其中 p 是事件的概率。.

逻辑回归是二元分类问题的基本算法。它是广义线性模型 (GLM) 的一种，将线性回归的思想扩展到结果变量不是连续的情况。将线性回归直接应用于二元（0/1）结果是有问题的，因为它可能产生逻辑 [0, 1] 范围之外的预测概率，并且违反了误差方差恒定的 OLS 假设。.

逻辑回归通过使用链接函数转换结果来解决这个问题。它将几率的对数或 ‘logit ’作为预测因子的线性函数建模。赔率是成功概率（[latex]p[/latex]）与失败概率（[latex]1-p[/latex]）之比。这种转换，[latex]/text{logit}(p) = \ln(p/(1-p))[/latex]，将概率从范围 [0, 1] 映射到整个实数线 [latex](-\infty,+\infty)[/latex]，使其适合线性模型。.

要返回到概率，可以应用 logit 函数的逆函数，即 logistic 或 sigmoid 函数：[latex]p = \frac{e^{\beta_0 + \beta_1 x_1 + \dots}}{1 + e^{\beta_0 + \beta_1 x_1 + \dots}}[/latex].与线性回归不同，参数（[latex]\beta[/latex]）不是用最小二乘法估算的。相反，通常使用最大似然估计法（MLE）来找到参数，这是一个迭代过程，可以找到使观察实际数据的可能性最大化的参数值。该模型可通过多项式逻辑回归进行扩展，以处理多类问题。.

机器学习, 质量保证, 质量控制, 质量管理, 统计分析, 统计过程控制（SPC）

UNESCO Nomenclature: 1209

- 统计资料

类型

软件/算法

中断

重大的

用法

广泛使用

前体

线性回归
概率论（伯努利分布）
最大似然估计（由 RA Fisher 开发）
Probit 模型（二元结果的早期模型）
广义线性模型的概念

应用程序

医学诊断（例如，根据症状预测疾病的存在）
信用评分和财务风险评估
电子邮件客户端中的垃圾邮件检测
电信和订阅服务中的客户流失预测
选举结果预测

专利：

潜在创新理念

由于机器人流量被拦截（目前每天超过 4 万），此内容仅限社区成员查看。
> 登录 > 或者 > 注册 < （100% 免费）即可访问此内容，以及所有其他受限内容和工具。

相关内容：逻辑回归、分类、二元结果、sigmoid 函数、log-odds、最大似然估计、机器学习、预测建模、广义线性模型、分类数据。.

历史背景

蒙特卡罗估计 Pi

蒙特卡罗方法的一个经典例子是估计 [latex]\pi[/latex] 的值。将半径为 [latex]r[/latex] 的圆嵌入边长为 [latex]2r[/latex] 的正方形中，它们的面积之比为 [latex]\frac\{pi r^2}{(2r)^2} = \frac\{pi}{4}[/latex]。在正方形内随机散布点，并计算落在圆内的 [latex]p[/latex] 的分数，就可以估算出：[latex]\pi （约 4p[/latex]）。.

格蕾丝-霍珀在 20 世纪 50 年代的一间办公室里研究 A-0 系统编译器。.

第一个编译器：A-0系统

A-0 系统由 Grace Hopper 于 1952 年创建，被广泛认为是第一个编译器。它将一系列由数学符号指定的子程序和参数翻译成机器码。这是从低级汇编编程向更高级、更抽象的编程语言转变的奠基性一步，使繁琐的手动代码翻译过程自动化。

西部电气规则（控制图中的统计检验）

这是一套用于检测休哈特控制图上非随机模式的四条决策规则，即使没有数据点超出3σ限值，也能指示过程失控。这些规则可以识别数据点的异常运行、趋势或聚集，这些异常表明存在特殊原因造成的变异。它们提高了控制图的灵敏度。

逻辑回归

OOP（编程）中的对象

在面向对象编程 (OOP) 中，对象是一个基本实体，它将数据（属性或特性）和操作这些数据的方法（函数或过程）捆绑在一起。对象是类的实例，充当蓝图。这种范式模拟现实世界中的实体，通过将相关的状态和行为分组到独立的单元中，使复杂系统更易于管理。

多态性（编程）

多态性（Polymorphism）源自希腊语，意为“多种形状”，它允许将不同类的对象视为一个共同超类的对象。它允许使用单个接口（例如方法名）来执行一类通用的操作。具体操作由运行时对象的确切类型决定。这通常通过方法重写来实现。

大都会-黑斯廷斯算法

Metropolis-Hastings算法是一种著名的马尔可夫链蒙特卡罗（MCMC）方法，用于从难以直接采样的概率分布中获取随机样本序列。在每次迭代中，它基于当前样本生成下一个样本的候选值。然后，该候选值以一定的概率被接受或拒绝，从而确保生成的链收敛到期望的分布。

1950

1952

1956

1960

1967

1970

1950

1953

1960

1967

1970

CNC运动插补

插补是 CNC 控制器内的计算过程，它生成一系列中间坐标点，以在编程的端点之间创建平滑路径。最基本的插补类型是用于直线的线性插补 (G01) 和用于圆弧的圆弧插补 (G02/G03)。这使得可以通过 G 代码程序中的简单几何命令来加工复杂的轮廓。

三重模块冗余（TMR）

三重模块冗余（TMR）是一种硬件容错技术，它使用三个相同的模块并行执行相同的操作。它们的输出被送入一个多数投票电路。如果一个模块发生故障并产生错误输出，投票电路仍然能够根据其他两个模块的输出确定正确的输出，从而掩盖故障并确保系统持续运行。

马尔可夫链蒙特卡罗（MCMC）

马尔可夫链蒙特卡罗（MCMC）方法是一类用于从概率分布中采样的算法。它构建一个马尔可夫链，使其平衡分布或平稳分布为目标分布。经过大量步骤后，链的状态被用作目标分布的样本，从而可以计算积分和期望值。

G-code：标准CNC编程语言

G 代码（正式名称为 RS-274）是用于控制 CNC 机床的最常用编程语言。它由一系列顺序命令组成，用于指示机床的定位、速度和特定操作。命令以字母地址开头；“G”表示运动准备命令（例如，G01 表示线性进给），而“M”表示辅助功能（例如，M03 表示主轴启动）。

自动定理证明（ATP）

自动定理证明（ATP）是计算机科学和数理逻辑的一个子领域，致力于使用计算机程序证明数学定理。ATP系统（或称证明器）运用逻辑推理，从一组公理和假设中推导出新的定理。它们与需要更多人工指导的证明辅助工具不同，尽管这两个领域存在显著的重叠。

继承（OOP编程）

继承是面向对象编程 (OOP) 中的一种机制，新类（子类或派生类）基于现有类（超类或基类），继承其属性和方法。继承支持代码复用，并在类之间建立自然的层次结构。子类可以扩展或覆盖继承的行为，从而允许更具体的实现，同时保持通用接口。

静态验证与动态验证（IT）

验证技术大致分为静态和动态两种。静态验证（或静态分析）在不执行的情况下检查系统的代码或设计。这方面的例子包括代码审查、检查和自动静态分析工具。动态验证（或测试）涉及使用一组输入执行系统，并观察其行为以发现缺陷。对于全面的质量保证而言，两者相辅相成。

风险优先级编号（RPN）

风险优先级编号 (RPN) 是 FMEA 中用于确定风险优先级的量化指标。其计算方法是三个排序因素的乘积：严重性（S）、发生率（O）和检测率（D）。计算公式为 [latex]RPN = S 乘以 O 乘以 D[/latex]。每个因素通常按 1 到 10 的等级评分，使团队能够首先关注得分最高的风险。.

（如果日期未知或不相关，例如“流体力学”，则提供其显著出现的近似估计）