Coefficient de détermination (R²)
Le coefficient de détermination (R²) est une statistique qui indique la qualité d'ajustement d'un modèle et représente la proportion de la variance de la variable dépendante qui est prévisible à partir de la ou des variables indépendantes. Un R² de 1 indique un ajustement parfait, tandis qu'un R² de 0 indique l'absence de relation linéaire. Il est calculé comme suit : R² = 1 × SSres / SStot, où SSres représente la somme des carrés des résidus.
Le coefficient de détermination (R²) est un indicateur clé pour l'évaluation des modèles de régression. Il fournit une mesure intuitive de la part de la variabilité de la variable dépendante expliquée par le modèle. Il est calculé à partir de deux composantes principales. La première est la somme des carrés totale (SStot = ∑i (yi - ŷ)2), qui mesure la variance totale de la variable dépendante y. La seconde est la somme des carrés résiduels (SSres = ∑i (yi - ŷi)2), qui mesure la variance non expliquée par le modèle, où ŷi est la valeur prédite.
La formule [latex]R² = 1 SS_{res}/SS_{tot}[/latex] peut être interprétée comme le pourcentage de variance totale expliquée par le modèle de régression. Par exemple, un R² de 0,75 signifie que 75 % de la variabilité de la variable réponse est expliquée par les prédicteurs du modèle. En régression linéaire simple, R² est simplement le carré du coefficient de corrélation de Pearson (r) entre les valeurs observées et prédites.
Cependant, le R² présente une limitation importante : il ne diminue jamais lorsqu’une nouvelle variable prédictive est ajoutée au modèle, même si cette variable est non pertinente. Cela peut être trompeur et favoriser le surajustement. Pour remédier à ce problème, le R² ajusté est souvent utilisé. Il modifie la valeur du R² pour tenir compte du nombre de prédicteurs du modèle, fournissant ainsi une mesure plus précise de l’adéquation de la régression multiple.
UNESCO Nomenclature: 1209
- Statistiques
Usage
Utilisation généralisée
Précurseurs
- Concept de variance et d'écart type
- Méthode des moindres carrés
- Coefficient de corrélation de Pearson
- Principes de l'analyse de la variance (ANOVA)
Applications
- évaluer les performances des modèles prédictifs en sciences et en ingénierie
- sélection de modèles en économétrie et en sciences sociales
- quantifier la proportion de variance expliquée par un ensemble de prédicteurs
- validation des modèles financiers pour l'évaluation des risques
Idées d'innovations potentielles
En raison du trafic généré par les robots de scraping, actuellement supérieur à 40 000 par jour, ce contenu est réservé aux membres de la communauté.
> Connexion < ou > Registre < (100% gratuit) pour y accéder, ainsi qu'à tous les autres contenus et outils à accès restreint.
En lien avec : r², coefficient de détermination, qualité de l’ajustement, évaluation du modèle, variance expliquée, somme des carrés, diagnostics de régression, signification statistique, r² ajusté, corrélation.