Product Design, Manufacturing & Innovation Resources

Hogar » Regresión logística

Regresión logística

1960

David Cox

(Imagen generada únicamente con fines ilustrativos)

Modelo de regresión para una variable dependiente categórica, normalmente binaria. En lugar de modelizar el resultado directamente, modela la probabilidad del resultado utilizando la función logística (sigmoide). El modelo predice las probabilidades logarítmicas del suceso como una combinación lineal de las variables independientes: [latex]\ln(\frac{p}{1-p}) = \beta_0 + \beta_1 x_1 + \dots + \beta_p x_p[/latex], donde p es la probabilidad del suceso.

La regresión logística es un algoritmo fundamental para problemas de clasificación binaria. Se trata de un tipo de modelo lineal generalizado (GLM) que extiende los principios de la regresión lineal a casos donde la variable de respuesta no es continua. Aplicar la regresión lineal directamente a una variable de respuesta binaria (0/1) resulta problemático, ya que puede generar probabilidades predichas fuera del intervalo lógico [0, 1] e incumple el supuesto de mínimos cuadrados ordinarios (MCO) de varianza de error constante.

La regresión logística resuelve este problema utilizando una función de enlace para transformar el resultado. Modela el logaritmo de las probabilidades, o «logit», como una función lineal de las variables predictoras. Las probabilidades son la razón entre la probabilidad de éxito (p) y la probabilidad de fracaso (1-p). Esta transformación, logit(p) = ln(p/(1-p)), traslada la probabilidad del intervalo [0, 1] a toda la recta numérica real (-∞, +∞), lo que la hace adecuada para un modelo lineal.

Para obtener una probabilidad, se aplica la inversa de la función logit, que es la función logística o sigmoide: [latex]p = frac{e^{beta_0 + beta_1 x_1 + dots}}{1 + e^{beta_0 + beta_1 x_1 + dots}}[/latex]. A diferencia de la regresión lineal, los parámetros ([latex]beta[/latex]) no se estiman mediante mínimos cuadrados. En cambio, se suelen encontrar mediante la Estimación de Máxima Verosimilitud (EMV), un proceso iterativo que halla los valores de los parámetros que maximizan la probabilidad de observar los datos reales. El modelo puede extenderse para manejar problemas de clasificación multiclase mediante regresión logística multinomial.

Aprendizaje automático, Seguro de calidad, Control de calidad, Gestión de calidad, Análisis estadístico, Control estadístico de procesos (CEP)

UNESCO Nomenclature: 1209

- Estadísticas

Tipo

Software/Algoritmo

Ruptura

Sustancial

Uso

Uso generalizado

Precursores

Regresión lineal
Teoría de la probabilidad (distribución de Bernoulli)
Estimación de máxima verosimilitud (desarrollada por RA Fisher)
Modelo Probit (un modelo anterior para resultados binarios)
El concepto de modelos lineales generalizados

Aplicaciones

diagnóstico médico (por ejemplo, predecir la presencia de una enfermedad basándose en los síntomas)
calificación crediticia y evaluación de riesgos financieros
detección de spam en clientes de correo electrónico
Predicción de la pérdida de clientes en telecomunicaciones y servicios de suscripción
predicción del resultado electoral

Patentes:

Ideas para posibles innovaciones

Debido al bloqueo del tráfico generado por bots, que actualmente supera los 40.000 al día, este contenido está reservado para los miembros de la comunidad.
> Iniciar sesión < o > Registrarse < (100% gratis) para acceder a esto, al igual que a todo el demás contenido y herramientas restringidos.

Relacionado con: regresión logística, clasificación, resultado binario, función sigmoide, logaritmo de probabilidades, estimación de máxima verosimilitud, aprendizaje automático, modelado predictivo, modelo lineal generalizado, datos categóricos.

Contexto histórico

Demostración en clase del método Monte Carlo para estimar Pi en el análisis numérico.

Estimación de Monte Carlo de Pi

Una ilustración clásica del método de Monte Carlo es la estimación del valor de [latex]\pi[/latex]. Al inscribir un círculo de radio [latex]r[/latex] dentro de un cuadrado de lado [latex]2r[/latex], la relación de sus áreas es [latex]\frac{\pi r^2}{(2r)^2} = \frac{\pi}{4}[/latex]. Esparciendo al azar puntos dentro del cuadrado y contando la fracción [latex]p[/latex] que caen dentro del círculo se obtiene una estimación: [latex]\pi \aprox 4p[/latex].

Grace Hopper trabajando en el compilador del Sistema A-0 en una oficina de los años 50.

El primer compilador: Sistema A-0

El Sistema A-0, creado en 1952 por Grace Hopper, es ampliamente considerado el primer compilador. Traducía una secuencia de subrutinas y argumentos, especificados mediante notación matemática, a código máquina. Este fue un paso fundamental en la transición de la programación en ensamblador de bajo nivel a lenguajes de programación de alto nivel y más abstractos, automatizando el tedioso proceso de traducción manual de código.

Analista de control de calidad que supervisa el gráfico de control Shewhart para detectar patrones no aleatorios.

Reglas de Western Electric (pruebas estadísticas en gráficos de control)

A set of four decision rules for detecting non-random patterns on Shewhart control charts, indicating an out-of-control process even if no points are outside the 3-sigma limits. These rules identify unnatural runs, trends, or clustering of data points that signal the presence of a special cause of variation. They increase the sensitivity of control charts.

Regresión logística

Espacio de trabajo de programación informática en el que se muestran conceptos de programación orientada a objetos.

El objeto en programación orientada a objetos

En la programación orientada a objetos (POO), un objeto es una entidad fundamental que agrupa datos (atributos o propiedades) y los métodos (funciones o procedimientos) que operan sobre dichos datos. Los objetos son instancias de clases, que actúan como planos. Este paradigma modela entidades del mundo real, facilitando la gestión de sistemas complejos al agrupar estados y comportamientos relacionados en unidades autónomas.

Espacio de trabajo de programación informática que demuestra el polimorfismo con fragmentos de código.

Polimorfismo (programación)

El polimorfismo, que del griego significa "muchas formas", permite que objetos de diferentes clases se traten como objetos de una superclase común. Permite utilizar una única interfaz, como el nombre de un método, para una clase general de acciones. La acción específica se determina por el tipo exacto del objeto en tiempo de ejecución. Esto suele lograrse mediante la sobreescritura de métodos.

Estadístico aplicando el algoritmo Metropolis-Hastings en un moderno laboratorio de investigación.

Algoritmo de Metropolis-Hastings

El algoritmo Metropolis-Hastings es un método MCMC destacado para obtener una secuencia de muestras aleatorias de una distribución de probabilidad en la que el muestreo directo es difícil. En cada iteración, genera un candidato para la siguiente muestra basándose en la muestra actual. Este candidato se acepta o rechaza con una probabilidad determinada, lo que garantiza que la cadena resultante converja a la distribución deseada.

1950

1952

1956

1960

1967

1970

1950

1953

1960

1967

1970

Interpolación del movimiento de ejecución de máquinas CNC para geometrías complejas en matemáticas aplicadas.

Interpolación de movimiento CNC

La interpolación es el proceso computacional dentro de un controlador CNC que genera una secuencia de puntos de coordenadas intermedios para crear una trayectoria uniforme entre los puntos finales programados. Los tipos más fundamentales son la interpolación lineal (G01) para líneas rectas y la interpolación circular (G02/G03) para arcos. Esto permite mecanizar perfiles complejos a partir de comandos geométricos simples en el programa de código G.

Sala de control aeroespacial con tres módulos informáticos paralelos para tolerancia a fallos.

Redundancia modular triple (TMR)

TMR (Triple Modular Redundancy) is a hardware fault-tolerance technique that uses three identical modules performing the same operation in parallel. Their outputs are fed into a majority-voting circuit. If one module fails and produces an incorrect output, the voter is still able to determine the correct output based on the other two modules, thus masking the fault and ensuring continuous operation.

Investigador analizando simulaciones Markov Chain Monte Carlo en una oficina de análisis estadístico.

Cadena de Markov Monte Carlo (MCMC)

Los métodos de Monte Carlo de Cadenas de Markov (MCMC) son un tipo de algoritmos para el muestreo de una distribución de probabilidad. Se construye una cadena de Markov cuya distribución deseada es su distribución de equilibrio o estacionaria. El estado de la cadena tras un gran número de pasos se utiliza como muestra de la distribución deseada, lo que permite el cálculo de integrales y expectativas.

Máquina CNC con programación de código G en un entorno de taller moderno.

G-code: el lenguaje de programación CNC estándar

El código G, formalmente conocido como RS-274, es el lenguaje de programación más común para controlar máquinas CNC. Consiste en comandos secuenciales que instruyen a la máquina sobre posicionamiento, velocidad y acciones específicas. Los comandos comienzan con una letra; «G» indica comandos preparatorios para el movimiento (p. ej., G01 para avance lineal), mientras que «M» significa funciones diversas (p. ej., M03 para el arranque del husillo).

Informático realizando demostraciones automáticas de teoremas en una oficina de la década de 1960.

Demostración automatizada de teoremas (ATP)

La demostración automatizada de teoremas (ATP) es un subcampo de la informática y la lógica matemática dedicado a la demostración de teoremas matemáticos mediante programas informáticos. Los sistemas ATP, o demostradores, utilizan el razonamiento lógico para deducir nuevos teoremas a partir de un conjunto de axiomas e hipótesis. Se diferencian de los asistentes de demostración, que requieren mayor orientación humana, aunque ambos campos se solapan significativamente.

Programador codificando herencia en programación orientada a objetos en una oficina moderna.

Herencia (programación orientada a objetos)

La herencia es un mecanismo en programación orientada a objetos (POO) donde una nueva clase (subclase o clase derivada) se basa en una clase existente (superclase o clase base), heredando sus atributos y métodos. Esto facilita la reutilización del código y establece una jerarquía natural entre clases. La subclase puede extender o anular el comportamiento heredado, lo que permite implementaciones más específicas manteniendo una interfaz común.

Ingeniero de software que realiza verificación estática utilizando herramientas de análisis de código en Informática.

Verificación estática frente a dinámica (TI)

Las técnicas de verificación se clasifican a grandes rasgos en estáticas o dinámicas. La verificación estática (o análisis estático) examina el código o el diseño del sistema sin ejecutarlo. Algunos ejemplos son las revisiones de código, las inspecciones y las herramientas automatizadas de análisis estático. La verificación dinámica (o prueba) consiste en ejecutar el sistema con un conjunto de entradas y observar su comportamiento para encontrar defectos. Ambas son complementarias para garantizar la calidad.

Reunión de evaluación de riesgos con ingenieros que analizan los Números de Prioridad de Riesgo en un despacho profesional.

Número de prioridad de riesgo (RPN)

El Número de Prioridad de Riesgo (NPR) es una medida cuantitativa utilizada en el AMFE para priorizar los riesgos. Se calcula como el producto de tres factores clasificados: Gravedad (S), Ocurrencia (O) y Detección (D). La fórmula es [latex]RPN = S por O por D[/latex]. Cada factor se suele clasificar en una escala del 1 al 10, lo que permite a los equipos centrarse primero en los riesgos con mayor puntuación.

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)