Product Design, Manufacturing & Innovation Resources
Lar » Coeficiente de Determinação (R²)

Coeficiente de Determinação (R²)

1900
  • Karl Pearson
Estatístico analisando dados de modelos de regressão em um ambiente de escritório.

(Imagem gerada apenas para fins ilustrativos)

Uma estatística que indica a qualidade do ajuste de um modelo, representando a proporção da variância na variável dependente que é previsível a partir da(s) variável(eis) independente(s). Um R² de 1 indica um ajuste perfeito, enquanto 0 indica nenhuma relação linear. É calculado como [latex]R^2 equiv 1 – frac{SS_{res}}{SS_{tot}}[/latex], onde [latex]SS_{res}[/latex] é a soma dos quadrados dos resíduos.

O coeficiente de determinação, R², é uma métrica fundamental para avaliar modelos de regressão. Ele fornece uma medida intuitiva de quanta variabilidade no resultado é capturada pelo modelo. É derivado de dois componentes principais. O primeiro é a Soma Total dos Quadrados (SStot = ∑i (yii ȳ)2), que mede a variância total na variável dependente y. O segundo é a Soma Residual dos Quadrados (SSres = ∑i (yii ȳ)2), que mede a variância não explicada pelo modelo, onde ȳ é o valor previsto.

A fórmula [latex]R^2 = 1 – SS_{res}/SS_{tot}[/latex] pode ser interpretada como a porcentagem da variância total que é ‘explicada’ pelo modelo de regressão. Por exemplo, um R² de 0,75 significa que 75% da variabilidade no resultado pode ser explicada pelos preditores no modelo. Na regressão linear simples, o R² é simplesmente o quadrado do coeficiente de correlação de Pearson (r) entre os valores observados e previstos.

No entanto, o R² apresenta uma limitação significativa: ele nunca diminui quando uma nova variável preditora é adicionada ao modelo, mesmo que a nova variável seja irrelevante. Isso pode ser enganoso e favorecer o sobreajuste. Para contornar esse problema, o R² ajustado é frequentemente utilizado. Ele modifica o valor de R² para levar em conta o número de preditores no modelo, fornecendo uma medida mais precisa da qualidade do ajuste para regressão múltipla.

UNESCO Nomenclature: 1209
Estatísticas

Tipo

Sistema abstrato

Interrupção

Substancial

Uso

Uso generalizado

Precursores

  • Conceito de variância e desvio padrão
  • Método dos mínimos quadrados
  • Coeficiente de correlação de Pearson
  • Analysis of variance (ANOVA) principles

Aplicações

  • avaliação do desempenho de modelos preditivos em ciência e engenharia
  • Seleção de modelos em econometria e ciências sociais
  • Quantificar a proporção da variância explicada por um conjunto de preditores.
  • Validação de modelos financeiros para avaliação de riscos

Patentes:

NA

Ideias de Inovação Potencial

Devido ao tráfego de bots de coleta de dados, atualmente superior a 40 mil por dia, este conteúdo é reservado aos membros da comunidade.
> Login < ou > Registrar < (100% gratuito) para acessar isso, assim como todo o restante do conteúdo e das ferramentas restritas.

Relacionado a: r-quadrado, coeficiente de determinação, qualidade do ajuste, avaliação do modelo, variância explicada, soma dos quadrados, diagnóstico de regressão, significância estatística, r-quadrado ajustado, correlação.

Contexto histórico

Coeficiente de Determinação (R²)

1854
1884
1896
1900
1903
1914
1924
1854
1854
1895
1899
1900
1911
1922
1925

(Caso a data seja desconhecida ou irrelevante, por exemplo, "mecânica dos fluidos", é fornecida uma estimativa aproximada de seu surgimento notável)

Princípios relacionados à invenção, inovação e tecnologia

Imagens em tamanho real e downloads estão disponíveis apenas, 100% gratuitos, para membros registrados.