Product Design, Manufacturing & Innovation Resources

Casa » Logistic Regression

Logistic Regression

1960

David Cox

(Immagine generata a solo scopo illustrativo)

Modello di regressione per una variabile dipendente categorica, tipicamente binaria. Invece di modellare direttamente l'esito, modella la probabilità dell'esito utilizzando la funzione logistica (sigmoide). Il modello predice le probabilità logiche dell'evento come combinazione lineare delle variabili indipendenti: [latex]\ln(\frac{p}{1-p}) = \beta_0 + \beta_1 x_1 + \dots + \beta_p x_p[/latex], dove p è la probabilità dell'evento.

La regressione logistica è un algoritmo fondamentale per i problemi di classificazione binaria. Si tratta di un tipo di modello lineare generalizzato (GLM) che estende i concetti della regressione lineare ai casi in cui la variabile dipendente non è continua. Applicare la regressione lineare direttamente a una variabile dipendente binaria (0/1) è problematico perché può produrre probabilità previste al di fuori dell'intervallo logico [0, 1] e viola l'assunto dei minimi quadrati ordinari (OLS) di varianza dell'errore costante.

La regressione logistica risolve questo problema utilizzando una funzione di collegamento per trasformare il risultato. Modella il logaritmo delle probabilità, o ‘logit’, come una funzione lineare dei predittori. Le probabilità sono il rapporto tra la probabilità di successo ([latex]p[/latex]) e la probabilità di insuccesso ([latex]1-p[/latex]). Questa trasformazione, [latex]text{logit}(p) = ln(p/(1-p))[/latex], mappa la probabilità dall'intervallo [0, 1] all'intera retta dei numeri reali [latex](-infty, +infty)[/latex], rendendola adatta a un modello lineare.

Per tornare a una probabilità, si applica l'inversa della funzione logit, ovvero la funzione logistica o sigmoide: [latex]p = frac{e^{beta_0 + beta_1 x_1 + dots}}{1 + e^{beta_0 + beta_1 x_1 + dots}}[/latex]. A differenza della regressione lineare, i parametri ([latex]beta[/latex]) non vengono stimati con il metodo dei minimi quadrati. Vengono invece tipicamente trovati utilizzando la stima di massima verosimiglianza (MLE), un processo iterativo che individua i valori dei parametri che massimizzano la probabilità di osservare i dati reali. Il modello può essere esteso per gestire problemi multiclasse tramite la regressione logistica multinomiale.

Apprendimento automatico, Garanzia di qualità, Controllo di qualità, Gestione della qualità, Analisi statistica, Controllo statistico di processo (SPC)

UNESCO Nomenclature: 1209

- Statistiche

Tipo

Software/Algoritmo

Interruzione

Sostanziale

Utilizzo

Uso diffuso

Precursori

Linear regression
Probability theory (Bernoulli distribution)
Maximum likelihood estimation (developed by R.A. Fisher)
Probit model (an earlier model for binary outcomes)
The concept of generalized linear models

Applicazioni

medical diagnosis (e.g., predicting disease presence based on symptoms)
credit scoring and financial risk assessment
spam detection in email clients
customer churn prediction in telecommunications and subscription services
election outcome prediction

Brevetti:

Idee e potenziali innovazioni

A causa dell'eliminazione del traffico generato dai bot, che attualmente supera i 40.000 al giorno, questo contenuto è riservato ai membri della community.
> Accedi O > Registrati L'accesso a questo contenuto, così come a tutti gli altri contenuti e strumenti riservati, è (100% gratuito).

Argomenti correlati: regressione logistica, classificazione, esito binario, funzione sigmoide, log-odds, stima di massima verosimiglianza, apprendimento automatico, modellazione predittiva, modello lineare generalizzato, dati categorici.

Contesto storico

Dimostrazione in aula del metodo Monte Carlo per la stima del Pi nell'analisi numerica.

Stima Monte Carlo di Pi

Un'illustrazione classica del metodo Monte Carlo è la stima del valore di [latex]\pi[/latex]. Inscrivendo un cerchio di raggio [latex]r[/latex] in un quadrato di lato [latex]2r[/latex], il rapporto tra le loro aree è [latex]\frac{\pi r^2}{(2r)^2} = \frac{\pi}{4}[/latex]. Sparpagliando a caso i punti all'interno del quadrato e contando la frazione [latex]p[/latex] che cade all'interno del cerchio si ottiene una stima: [latex]\pi \approssimativamente 4p[/latex].

Grace Hopper al lavoro sul compilatore A-0 System in un ufficio degli anni Cinquanta.

Il primo compilatore: sistema A-0

Il sistema A-0, creato nel 1952 da Grace Hopper, è ampiamente considerato il primo compilatore. Traduceva una sequenza di subroutine e argomenti, specificati da una notazione matematica, in codice macchina. Questo fu un passo fondamentale nel passaggio dalla programmazione assembly di basso livello a linguaggi di programmazione di livello superiore e più astratti, automatizzando il noioso processo di traduzione manuale del codice.

Analista del controllo qualità che monitora il diagramma di controllo di Shewhart per rilevare modelli non casuali.

Regole Western Electric (test statistici nei grafici di controllo)

Un insieme di quattro regole decisionali per rilevare pattern non casuali sulle carte di controllo di Shewhart, che indicano un processo fuori controllo anche se nessun punto si trova al di fuori dei limiti di 3 sigma. Queste regole identificano andamenti innaturali, trend o clustering di punti dati che segnalano la presenza di una causa specifica di variazione. Aumentano la sensibilità delle carte di controllo.

Logistic Regression

Spazio di lavoro per la programmazione informatica che illustra i concetti di programmazione orientata agli oggetti.

L'oggetto nella programmazione OOP

Nella programmazione orientata agli oggetti (OOP), un oggetto è un'entità fondamentale che raggruppa dati (attributi o proprietà) e i metodi (funzioni o procedure) che operano su tali dati. Gli oggetti sono istanze di classi, che fungono da modelli. Questo paradigma modella entità del mondo reale, semplificando la gestione di sistemi complessi raggruppando stati e comportamenti correlati in unità autonome.

Area di lavoro per la programmazione informatica che dimostra il polimorfismo con frammenti di codice.

Polimorfismo (programmazione)

Il polimorfismo, dal greco "molte forme", consente di trattare oggetti di classi diverse come oggetti di una superclasse comune. Permette di utilizzare una singola interfaccia, come il nome di un metodo, per una classe generale di azioni. L'azione specifica è determinata dal tipo esatto dell'oggetto in fase di esecuzione. Questo risultato si ottiene spesso tramite l'override dei metodi.

Algoritmo Metropolis-Hastings

L'algoritmo Metropolis-Hastings è un metodo MCMC di primo piano per ottenere una sequenza di campioni casuali da una distribuzione di probabilità per la quale il campionamento diretto risulta difficile. A ogni iterazione, genera un candidato per il campione successivo basato sul campione corrente. Questo candidato viene quindi accettato o rifiutato con una certa probabilità, garantendo che la catena risultante converga alla distribuzione desiderata.

1950

1952

1956

1960

1967

1970

1950

1953

1960

1967

1970

Interpolazione del movimento di macchine CNC per geometrie complesse in matematica applicata.

Interpolazione del movimento CNC

L'interpolazione è il processo computazionale all'interno di un controllo CNC che genera una sequenza di punti di coordinate intermedi per creare un percorso fluido tra i punti finali programmati. I tipi più fondamentali sono l'interpolazione lineare (G01) per le linee rette e l'interpolazione circolare (G02/G03) per gli archi. Ciò consente di lavorare profili complessi a partire da semplici comandi geometrici nel programma G-code.

Sala di controllo aerospaziale con tre moduli informatici paralleli per la tolleranza ai guasti.

Tripla ridondanza modulare (TMR)

TMR (Triple Modular Redundancy) è una tecnica di tolleranza ai guasti hardware che utilizza tre moduli identici che eseguono la stessa operazione in parallelo. Le loro uscite vengono immesse in un circuito a maggioranza. Se un modulo si guasta e produce un'uscita errata, il votante è comunque in grado di determinare l'uscita corretta in base agli altri due moduli, mascherando così il guasto e garantendo la continuità di funzionamento.

Ricercatore che analizza simulazioni Markov Chain Monte Carlo in un ufficio di analisi statistica.

Catena di Markov Monte Carlo (MCMC)

I metodi Markov Chain Monte Carlo (MCMC) sono una classe di algoritmi per il campionamento da una distribuzione di probabilità. Viene costruita una catena di Markov che ha la distribuzione desiderata come distribuzione di equilibrio o stazionaria. Lo stato della catena dopo un gran numero di passaggi viene quindi utilizzato come campione dalla distribuzione desiderata, consentendo il calcolo di integrali e valori attesi.

Macchina a controllo numerico con programmazione G-code in una moderna officina.

G-code: il linguaggio di programmazione CNC standard

Il codice G, formalmente noto come RS-274, è il linguaggio di programmazione più diffuso per il controllo delle macchine CNC. Consiste in comandi sequenziali che impartiscono istruzioni alla macchina su posizionamento, velocità e azioni specifiche. I comandi iniziano con una lettera; "G" indica i comandi preparatori per il movimento (ad esempio, G01 per l'avanzamento lineare), mentre "M" indica funzioni varie (ad esempio, M03 per l'avvio del mandrino).

Informatico che conduce una dimostrazione automatica di teoremi in un ufficio degli anni '60.

Dimostrazione automatica di teoremi (ATP)

La dimostrazione automatica di teoremi (ATP) è un sottocampo dell'informatica e della logica matematica dedicato alla dimostrazione di teoremi matematici utilizzando programmi per computer. I sistemi ATP, o dimostratori, utilizzano il ragionamento logico per dedurre nuovi teoremi da un insieme di assiomi e ipotesi. Sono diversi dagli assistenti alla dimostrazione, che richiedono una maggiore guida umana, sebbene i due campi si sovrappongano significativamente.

Programmatore che codifica l'eredità nella programmazione orientata agli oggetti in un ufficio moderno.

Ereditarietà (programmazione OOP)

L'ereditarietà è un meccanismo della programmazione orientata agli oggetti in cui una nuova classe (sottoclasse o classe derivata) si basa su una classe esistente (superclasse o classe base), ereditandone attributi e metodi. Questo supporta la riutilizzabilità del codice e stabilisce una gerarchia naturale tra le classi. La sottoclasse può estendere o sovrascrivere il comportamento ereditato, consentendo implementazioni più specifiche pur mantenendo un'interfaccia comune.

Ingegnere del software che esegue la verifica statica utilizzando strumenti di analisi del codice in Informatica.

Verifica statica e dinamica (IT)

Le tecniche di verifica sono ampiamente classificate come statiche o dinamiche. La verifica statica (o analisi statica) esamina il codice o la progettazione del sistema senza eseguirlo. Ne sono un esempio le revisioni del codice, le ispezioni e gli strumenti di analisi statica automatizzati. La verifica dinamica (o test) prevede l'esecuzione del sistema con una serie di input e l'osservazione del suo comportamento per individuare i difetti. Entrambi sono complementari per una garanzia di qualità completa.

Riunione di valutazione del rischio con ingegneri che analizzano i numeri di priorità del rischio in un ufficio professionale.

Numero di priorità del rischio (RPN)

Il numero di priorità del rischio (RPN) è una misura quantitativa utilizzata nell'FMEA per dare priorità ai rischi. È calcolato come il prodotto di tre fattori classificati: Gravità (S), Occorrenza (O) e Rilevamento (D). La formula è [latex]RPN = S per O per D[/latex]. Ogni fattore è tipicamente classificato su una scala da 1 a 10, consentendo ai team di concentrarsi prima sui rischi con i punteggi più alti.

(se la data è sconosciuta o non rilevante, ad esempio "meccanica dei fluidi", viene fornita una stima approssimativa della sua notevole comparsa)