Product Design, Manufacturing & Innovation Resources

Maison » Régression logistique

Régression logistique

1960

David Cox

(Image générée à titre d'illustration uniquement)

Modèle de régression pour une variable dépendante catégorique, généralement binaire. Au lieu de modéliser directement le résultat, il modélise la probabilité du résultat à l'aide de la fonction logistique (sigmoïde). Le modèle prédit le log-odds de l'événement comme une combinaison linéaire des variables indépendantes : [latex]\ln(\frac{p}{1-p}) = \beta_0 + \beta_1 x_1 + \dots + \beta_p x_p[/latex], où p est la probabilité de l'événement.

La régression logistique est un algorithme fondamental pour les problèmes de classification binaire. C'est un type de modèle linéaire généralisé (GLM) qui étend les principes de la régression linéaire aux cas où la variable dépendante n'est pas continue. Appliquer directement la régression linéaire à une variable dépendante binaire (0/1) est problématique car cela peut produire des probabilités prédites en dehors de l'intervalle logique [0, 1] et viole l'hypothèse des moindres carrés ordinaires (MCO) d'homoscédasticité.

La régression logistique résout ce problème en utilisant une fonction de lien pour transformer la variable dépendante. Elle modélise le logarithme des cotes, ou `logit`, comme une fonction linéaire des prédicteurs. Les cotes sont le rapport entre la probabilité de succès (`p`) et la probabilité d'échec (`1-p`). Cette transformation, `logit(p) = ln(p/(1-p))`, fait passer la probabilité de l'intervalle [0, 1] à l'ensemble des nombres réels [-∞, +∞)], la rendant ainsi compatible avec un modèle linéaire.

Pour obtenir une probabilité, on applique la fonction inverse de la fonction logit, c'est-à-dire la fonction logistique ou sigmoïde : p = e^(β₀ + β₁x₁ + …) / (1 + e^(β₀ + β₁x₁ + …). Contrairement à la régression linéaire, les paramètres (β) ne sont pas estimés par la méthode des moindres carrés. Ils sont généralement déterminés par l'estimation du maximum de vraisemblance (EMV), un processus itératif qui trouve les valeurs des paramètres maximisant la vraisemblance d'observer les données réelles. Le modèle peut être étendu aux problèmes multiclasses grâce à la régression logistique multinomiale.

Machine Learning, Assurance qualité, Contrôle de qualité, Gestion de la qualité, Statistical Analysis, Contrôle statistique des processus (CSP)

UNESCO Nomenclature: 1209

- Statistiques

Taper

Logiciel/Algorithme

Perturbation

Substantiel

Usage

Utilisation généralisée

Précurseurs

Régression linéaire
Théorie des probabilités (distribution de Bernoulli)
Estimation du maximum de vraisemblance (développée par RA Fisher)
Modèle Probit (un modèle antérieur pour les résultats binaires)
Le concept de modèles linéaires généralisés

Applications

diagnostic médical (par exemple, prédire la présence d'une maladie en fonction des symptômes)
notation de crédit et évaluation des risques financiers
détection de spam dans les clients de messagerie
prévision du taux de désabonnement des clients dans les services de télécommunications et d'abonnement
prédiction du résultat des élections

Brevets:

Idées d'innovations potentielles

En raison du trafic généré par les robots de scraping, actuellement supérieur à 40 000 par jour, ce contenu est réservé aux membres de la communauté.
> Connexion < ou > Registre < (100% gratuit) pour y accéder, ainsi qu'à tous les autres contenus et outils à accès restreint.

En lien avec : régression logistique, classification, résultat binaire, fonction sigmoïde, logarithme des cotes, estimation du maximum de vraisemblance, apprentissage automatique, modélisation prédictive, modèle linéaire généralisé, données catégorielles.

Contexte historique

Démonstration en classe de la méthode Monte Carlo pour l'estimation de Pi en analyse numérique.

Estimation de Pi par Monte-Carlo

Une illustration classique de la méthode de Monte Carlo est l'estimation de la valeur de [latex]\pi[/latex]. En inscrivant un cercle de rayon [latex]r[/latex] dans un carré de côté [latex]2r[/latex], le rapport de leurs surfaces est [latex]\frac{\pi r^2}{(2r)^2} = \frac{\pi}{4}[/latex]. En dispersant aléatoirement des points à l'intérieur du carré et en comptant la fraction [latex]p[/latex] qui tombe à l'intérieur du cercle, on obtient une estimation : [latex]\pi \approx 4p[/latex].

Grace Hopper travaillant sur le compilateur du système A-0 dans un bureau des années 1950.

Le premier compilateur : le système A-0

Le système A-0, créé en 1952 par Grace Hopper, est largement considéré comme le premier compilateur. Il traduisait une séquence de sous-routines et d'arguments, spécifiée par une notation mathématique, en code machine. Ce fut une étape fondamentale dans le passage de la programmation assembleur de bas niveau à des langages de programmation plus abstraits et de plus haut niveau, automatisant le processus fastidieux de traduction manuelle du code.

Analyste du contrôle de la qualité surveillant la carte de contrôle de Shewhart pour y déceler des schémas non aléatoires.

Règles de Western Electric (tests statistiques dans les cartes de contrôle)

Un ensemble de quatre règles de décision permet de détecter les anomalies sur les cartes de contrôle de Shewhart, indiquant un processus hors contrôle même si aucun point ne se situe en dehors des limites à 3 sigma. Ces règles identifient les séries anormales, les tendances ou les regroupements de points de données qui signalent la présence d'une cause spéciale de variation. Elles améliorent la sensibilité des cartes de contrôle.

Régression logistique

Espace de travail de programmation informatique présentant les concepts de la programmation orientée objet.

L'objet en programmation orientée objet (POO)

En programmation orientée objet (POO), un objet est une entité fondamentale qui regroupe des données (attributs ou propriétés) et les méthodes (fonctions ou procédures) qui les exploitent. Les objets sont des instances de classes, qui agissent comme des plans directeurs. Ce paradigme modélise des entités du monde réel, facilitant la gestion des systèmes complexes en regroupant les états et comportements associés en unités autonomes.

Espace de travail de programmation informatique démontrant le polymorphisme avec des extraits de code.

Polymorphisme (programmation)

Le polymorphisme, du grec « multiples formes », permet de traiter des objets de classes différentes comme des objets d'une superclasse commune. Il permet d'utiliser une interface unique, comme un nom de méthode, pour une classe générale d'actions. L'action spécifique est déterminée par le type exact de l'objet à l'exécution. Ceci est souvent réalisé par substitution de méthode.

Statisticien appliquant l'algorithme Metropolis-Hastings dans un laboratoire de recherche moderne.

Algorithme de Metropolis-Hastings

L'algorithme de Metropolis-Hastings est une méthode MCMC reconnue pour générer une séquence d'échantillons aléatoires à partir d'une distribution de probabilité pour laquelle l'échantillonnage direct est difficile. À chaque itération, il génère un candidat pour l'échantillon suivant à partir de l'échantillon courant. Ce candidat est ensuite accepté ou rejeté avec une certaine probabilité, garantissant ainsi la convergence de la chaîne vers la distribution souhaitée.

1950

1952

1956

1960

1967

1970

1950

1953

1960

1967

1970

Interpolation des mouvements d'exécution des machines CNC pour les géométries complexes en mathématiques appliquées.

Interpolation de mouvement CNC

L'interpolation est le processus de calcul d'un contrôleur CNC qui génère une séquence de points de coordonnées intermédiaires afin de créer une trajectoire fluide entre les points d'extrémité programmés. Les types d'interpolation les plus courants sont l'interpolation linéaire (G01) pour les lignes droites et l'interpolation circulaire (G02/G03) pour les arcs. Cela permet d'usiner des profils complexes à partir de commandes géométriques simples du programme G-code.

Salle de contrôle aérospatiale avec trois modules informatiques parallèles pour la tolérance aux pannes.

Redondance modulaire triple (TMR)

La redondance modulaire triple (TMR) est une technique de tolérance aux pannes matérielle qui utilise trois modules identiques effectuant la même opération en parallèle. Leurs sorties sont acheminées vers un circuit de vote majoritaire. Si un module tombe en panne et produit une sortie incorrecte, le circuit majoritaire peut néanmoins déterminer la sortie correcte grâce aux informations fournies par les deux autres modules, masquant ainsi la panne et assurant la continuité de fonctionnement.

Chercheur analysant des simulations de Monte Carlo par chaîne de Markov dans un bureau d'analyse statistique.

Chaîne de Markov Monte Carlo (MCMC)

Les méthodes de Monte Carlo par chaînes de Markov (MCMC) constituent une classe d'algorithmes d'échantillonnage d'une distribution de probabilité. Une chaîne de Markov est construite, dont la distribution d'équilibre (ou stationnaire) correspond à la distribution recherchée. L'état de la chaîne après un grand nombre d'itérations est ensuite utilisé comme échantillon de la distribution recherchée, permettant ainsi le calcul d'intégrales et d'espérances.

Machine CNC avec programmation G-code dans un atelier moderne.

G-code : le langage de programmation CNC standard

Le code G, anciennement appelé RS-274, est le langage de programmation le plus répandu pour le contrôle des machines CNC. Il se compose de commandes séquentielles qui indiquent à la machine son positionnement, sa vitesse et des actions spécifiques. Les commandes commencent par une lettre ; « G » désigne les commandes préparatoires au mouvement (par exemple, G01 pour l'avance linéaire), tandis que « M » désigne les fonctions diverses (par exemple, M03 pour le démarrage de la broche).

Informaticien effectuant une démonstration automatique de théorèmes dans un bureau des années 1960.

Démonstration automatique de théorèmes (ATP)

La démonstration automatique de théorèmes (DAT) est une branche de l'informatique et de la logique mathématique qui consiste à démontrer des théorèmes mathématiques à l'aide de programmes informatiques. Les systèmes de DAT, ou démonstrateurs, utilisent le raisonnement logique pour déduire de nouveaux théorèmes à partir d'un ensemble d'axiomes et d'hypothèses. Ils se distinguent des assistants de preuve, qui nécessitent une intervention humaine plus importante, bien que les deux domaines présentent des similitudes significatives.

Programmeur codant l'héritage en programmation orientée objet dans un bureau moderne.

Héritage (programmation OOP)

L'héritage est un mécanisme de POO où une nouvelle classe (sous-classe ou classe dérivée) est basée sur une classe existante (super-classe ou classe de base), héritant de ses attributs et méthodes. Cela favorise la réutilisabilité du code et établit une hiérarchie naturelle entre les classes. La sous-classe peut étendre ou remplacer le comportement hérité, permettant ainsi des implémentations plus spécifiques tout en conservant une interface commune.

Ingénieur logiciel effectuant une vérification statique à l'aide d'outils d'analyse de code en informatique.

Vérification statique et vérification dynamique (IT)

Les techniques de vérification sont généralement classées en deux catégories : statique et dynamique. La vérification statique (ou analyse statique) examine le code ou la conception du système sans l'exécuter. Les exemples incluent les revues de code, les inspections et les outils d'analyse statique automatisés. La vérification dynamique (ou test) implique l'exécution du système avec un ensemble d'entrées et l'observation de son comportement pour trouver les défauts. Ces deux méthodes sont complémentaires pour une assurance qualité complète.

Réunion d'évaluation des risques avec des ingénieurs analysant les numéros de priorité des risques dans un bureau professionnel.

Numéro de priorité de risque (RPN)

L'indice de priorité des risques (IPR) est une mesure quantitative utilisée dans l'AMDE pour classer les risques par ordre de priorité. Il est calculé comme le produit de trois facteurs classés : Gravité (S), Occurrence (O) et Détection (D). La formule est [latex]RPN = S fois O fois D[/latex]. Chaque facteur est généralement évalué sur une échelle de 1 à 10, ce qui permet aux équipes de se concentrer d'abord sur les risques les mieux notés.

(si la date est inconnue ou non pertinente, par exemple « mécanique des fluides », une estimation arrondie de son émergence notable est fournie)