Product Design, Manufacturing & Innovation Resources
Maison » Coefficient de détermination (R²)

Coefficient de détermination (R²)

1900
  • Karl Pearson
Statisticien analysant des données de modèle de régression dans un environnement de bureau.

(Image générée à titre d'illustration uniquement)

Le coefficient de détermination (R²) est une statistique qui indique la qualité d'ajustement d'un modèle et représente la proportion de la variance de la variable dépendante qui est prévisible à partir de la ou des variables indépendantes. Un R² de 1 indique un ajustement parfait, tandis qu'un R² de 0 indique l'absence de relation linéaire. Il est calculé comme suit : R² = 1 × SSres / SStot, où SSres représente la somme des carrés des résidus.

Le coefficient de détermination (R²) est un indicateur clé pour l'évaluation des modèles de régression. Il fournit une mesure intuitive de la part de la variabilité de la variable dépendante expliquée par le modèle. Il est calculé à partir de deux composantes principales. La première est la somme des carrés totale (SStot = ∑i (yi - ŷ)2), qui mesure la variance totale de la variable dépendante y. La seconde est la somme des carrés résiduels (SSres = ∑i (yi - ŷi)2), qui mesure la variance non expliquée par le modèle, où ŷi est la valeur prédite.

La formule [latex]R² = 1 SS_{res}/SS_{tot}[/latex] peut être interprétée comme le pourcentage de variance totale expliquée par le modèle de régression. Par exemple, un R² de 0,75 signifie que 75 % de la variabilité de la variable réponse est expliquée par les prédicteurs du modèle. En régression linéaire simple, R² est simplement le carré du coefficient de corrélation de Pearson (r) entre les valeurs observées et prédites.

Cependant, le R² présente une limitation importante : il ne diminue jamais lorsqu’une nouvelle variable prédictive est ajoutée au modèle, même si cette variable est non pertinente. Cela peut être trompeur et favoriser le surajustement. Pour remédier à ce problème, le R² ajusté est souvent utilisé. Il modifie la valeur du R² pour tenir compte du nombre de prédicteurs du modèle, fournissant ainsi une mesure plus précise de l’adéquation de la régression multiple.

UNESCO Nomenclature: 1209
- Statistiques

Taper

Système abstrait

Perturbation

Substantiel

Usage

Utilisation généralisée

Précurseurs

  • Concept de variance et d'écart type
  • Méthode des moindres carrés
  • Coefficient de corrélation de Pearson
  • Principes de l'analyse de la variance (ANOVA)

Applications

  • évaluer les performances des modèles prédictifs en sciences et en ingénierie
  • sélection de modèles en économétrie et en sciences sociales
  • quantifier la proportion de variance expliquée par un ensemble de prédicteurs
  • validation des modèles financiers pour l'évaluation des risques

Brevets:

NA

Idées d'innovations potentielles

En raison du trafic généré par les robots de scraping, actuellement supérieur à 40 000 par jour, ce contenu est réservé aux membres de la communauté.
> Connexion < ou > Registre < (100% gratuit) pour y accéder, ainsi qu'à tous les autres contenus et outils à accès restreint.

En lien avec : r², coefficient de détermination, qualité de l’ajustement, évaluation du modèle, variance expliquée, somme des carrés, diagnostics de régression, signification statistique, r² ajusté, corrélation.

Contexte historique

Coefficient de détermination (R²)

1854
1884
1896
1900
1903
1914
1924
1854
1854
1895
1899
1900
1911
1922
1925

(si la date est inconnue ou non pertinente, par exemple « mécanique des fluides », une estimation arrondie de son émergence notable est fournie)

Inventions, innovations et principes techniques connexes

Les images en pleine résolution et les téléchargements sont uniquement disponibles, et 100% gratuits, pour les membres inscrits.