A statistic indicating the goodness of fit of a model, representing the proportion of the variance in the dependent variable that is predictable from the independent variable(s). An R² of 1 indicates a perfect fit, while 0 indicates no linear relationship. It is calculated as [latex]R^2 \equiv 1 – \frac{SS_{res}}{SS_{tot}}[/latex], where [latex]SS_{res}[/latex] is the residual sum of squares.
Coefficient of Determination (R²)
- Karl Pearson
The coefficient of determination, R-squared, is a key metric for evaluating regression models. It provides an intuitive measure of how much of the variability in the outcome is captured by the model. It is derived from two key components. The first is the Total Sum of Squares ([latex]SS_{tot} = \sum_i (y_i – \bar{y})^2[/latex]), which measures the total variance in the dependent variable [latex]y[/latex]. The second is the Residual Sum of Squares ([latex]SS_{res} = \sum_i (y_i – \hat{y}_i)^2[/latex]), which measures the variance left unexplained by the model, where [latex]\hat{y}_i[/latex] is the predicted value.
The formula [latex]R^2 = 1 – SS_{res}/SS_{tot}[/latex] can be interpreted as the percentage of total variance that is ‘explained’ by the regression model. For instance, an R² of 0.75 means that 75% of the variability in the outcome can be accounted for by the predictors in the model. In simple linear regression, R² is simply the square of Pearson’s correlation coefficient (r) between the observed and predicted values.
However, R² has a significant limitation: it never decreases when a new predictor variable is added to the model, even if the new variable is irrelevant. This can be misleading and encourage overfitting. To counteract this, the Adjusted R-squared is often used. It modifies the R² value to account for the number of predictors in the model, providing a more accurate measure of goodness of fit for multiple regression.
Typ
Unterbrechung
Verwendung
Vorläufersubstanzen
- Concept of variance and standard deviation
- Method of least squares
- Pearson’s product-moment correlation coefficient
- Analyse der Varianz (ANOVA) Grundsätze
Anwendungen
- evaluating the performance of predictive models in science and engineering
- model selection in econometrics and social sciences
- quantifying the proportion of variance explained by a set of predictors
- validating financial models for risk assessment
Patente:
Mögliche Innovationsideen
!Professionals (100% free) Mitgliedschaft erforderlich
Sie müssen ein Professionals (100% free) Mitglied sein, um auf diesen Inhalt zugreifen zu können.
VERFÜGBAR FÜR NEUE HERAUSFORDERUNGEN
Maschinenbauingenieur, Projekt-, Verfahrenstechnik- oder F&E-Manager
Kurzfristig für eine neue Herausforderung verfügbar.
Kontaktieren Sie mich auf LinkedIn
Integration von Kunststoff-Metall-Elektronik, Design-to-Cost, GMP, Ergonomie, Geräte und Verbrauchsmaterialien in mittleren bis hohen Stückzahlen, Lean Manufacturing, regulierte Branchen, CE und FDA, CAD, Solidworks, Lean Sigma Black Belt, medizinische ISO 13485
Wir suchen einen neuen Sponsor
Ihr Unternehmen oder Ihre Institution beschäftigt sich mit Technik, Wissenschaft oder Forschung?
> Senden Sie uns eine Nachricht <
Erhalten Sie alle neuen Artikel
Kostenlos, kein Spam, E-Mail wird nicht verteilt oder weiterverkauft
oder Sie können eine kostenlose Vollmitgliedschaft erwerben, um auf alle eingeschränkten Inhalte zuzugreifen >Hier<
Verwandte Erfindungen, Innovationen und technische Prinzipien