Coeficiente de Determinação (R²)
Uma estatística que indica a qualidade do ajuste de um modelo, representando a proporção da variância na variável dependente que é previsível a partir da(s) variável(eis) independente(s). Um R² de 1 indica um ajuste perfeito, enquanto 0 indica nenhuma relação linear. É calculado como [latex]R^2 equiv 1 – frac{SS_{res}}{SS_{tot}}[/latex], onde [latex]SS_{res}[/latex] é a soma dos quadrados dos resíduos.
O coeficiente de determinação, R², é uma métrica fundamental para avaliar modelos de regressão. Ele fornece uma medida intuitiva de quanta variabilidade no resultado é capturada pelo modelo. É derivado de dois componentes principais. O primeiro é a Soma Total dos Quadrados (SStot = ∑i (yi ∑i ȳ)2), que mede a variância total na variável dependente y. O segundo é a Soma Residual dos Quadrados (SSres = ∑i (yi ∑i ȳ)2), que mede a variância não explicada pelo modelo, onde ȳ é o valor previsto.
A fórmula [latex]R^2 = 1 – SS_{res}/SS_{tot}[/latex] pode ser interpretada como a porcentagem da variância total que é ‘explicada’ pelo modelo de regressão. Por exemplo, um R² de 0,75 significa que 75% da variabilidade no resultado pode ser explicada pelos preditores no modelo. Na regressão linear simples, o R² é simplesmente o quadrado do coeficiente de correlação de Pearson (r) entre os valores observados e previstos.
No entanto, o R² apresenta uma limitação significativa: ele nunca diminui quando uma nova variável preditora é adicionada ao modelo, mesmo que a nova variável seja irrelevante. Isso pode ser enganoso e favorecer o sobreajuste. Para contornar esse problema, o R² ajustado é frequentemente utilizado. Ele modifica o valor de R² para levar em conta o número de preditores no modelo, fornecendo uma medida mais precisa da qualidade do ajuste para regressão múltipla.
UNESCO Nomenclature: 1209
Estatísticas
Precursores
- Conceito de variância e desvio padrão
- Método dos mínimos quadrados
- Coeficiente de correlação de Pearson
- Analysis of variance (ANOVA) principles
Aplicações
- avaliação do desempenho de modelos preditivos em ciência e engenharia
- Seleção de modelos em econometria e ciências sociais
- Quantificar a proporção da variância explicada por um conjunto de preditores.
- Validação de modelos financeiros para avaliação de riscos
Ideias de Inovação Potencial
Devido ao tráfego de bots de coleta de dados, atualmente superior a 40 mil por dia, este conteúdo é reservado aos membros da comunidade.
> Login < ou > Registrar < (100% gratuito) para acessar isso, assim como todo o restante do conteúdo e das ferramentas restritas.
Relacionado a: r-quadrado, coeficiente de determinação, qualidade do ajuste, avaliação do modelo, variância explicada, soma dos quadrados, diagnóstico de regressão, significância estatística, r-quadrado ajustado, correlação.