R²은 모델의 적합도를 나타내는 통계량으로, 종속 변수의 분산 중 독립 변수로부터 예측 가능한 부분의 비율을 나타냅니다. R² 값이 1이면 완벽한 적합을 의미하고, 0이면 선형 관계가 없음을 의미합니다. R²은 [latex]R^2 equiv 1 – frac{SS_{res}}{SS_{tot}}[/latex]로 계산되며, 여기서 [latex]SS_{res}[/latex]는 잔차 제곱합입니다.

(설명을 위한 생성된 이미지입니다)
R²은 모델의 적합도를 나타내는 통계량으로, 종속 변수의 분산 중 독립 변수로부터 예측 가능한 부분의 비율을 나타냅니다. R² 값이 1이면 완벽한 적합을 의미하고, 0이면 선형 관계가 없음을 의미합니다. R²은 [latex]R^2 equiv 1 – frac{SS_{res}}{SS_{tot}}[/latex]로 계산되며, 여기서 [latex]SS_{res}[/latex]는 잔차 제곱합입니다.
결정계수(R-제곱)는 회귀 모델을 평가하는 핵심 지표입니다. 이는 모델이 결과 변수의 변동성을 얼마나 잘 설명하는지를 직관적으로 보여줍니다. 결정계수는 두 가지 주요 구성 요소로 이루어져 있습니다. 첫 번째는 총 제곱합([latex]SS_{tot} = sum_i (y_i – bar{y})^2[/latex])으로, 종속 변수 [latex]y[/latex]의 총 분산을 측정합니다. 두 번째는 잔차 제곱합([latex]SS_{res} = sum_i (y_i – hat{y}_i)^2[/latex])으로, 모델이 설명하지 못하는 분산을 측정합니다. 여기서 [latex]hat{y}_i[/latex]는 예측값입니다.
공식 [latex]R^2 = 1 – SS_{res}/SS_{tot}[/latex]는 회귀 모델이 전체 분산 중 '설명하는' 비율을 나타냅니다. 예를 들어, R² 값이 0.75라는 것은 결과 변수의 변동성 중 75%가 모델의 예측 변수에 의해 설명된다는 의미입니다. 단순 선형 회귀에서 R²는 관측값과 예측값 사이의 피어슨 상관계수(r)의 제곱입니다.
하지만 R²에는 중요한 한계가 있습니다. 새로운 예측 변수가 모델에 추가되더라도, 설령 그 변수가 모델과 무관하더라도 R² 값은 절대 감소하지 않습니다. 이는 오해를 불러일으키고 과적합을 유발할 수 있습니다. 이러한 한계를 극복하기 위해 조정된 R² 값이 자주 사용됩니다. 조정된 R² 값은 모델에 포함된 예측 변수의 개수를 고려하여 R² 값을 수정함으로써 다중 회귀 분석의 적합도를 보다 정확하게 측정합니다.
현재 하루 4만 건이 넘는 봇 트래픽을 차단하기 위해 이 콘텐츠는 커뮤니티 회원만 이용할 수 있습니다.
> 로그인 < 또는 >등록 < 이 콘텐츠를 비롯한 모든 제한된 콘텐츠와 도구는 (100% 무료로) 이용할 수 있습니다.
결정계수(R²)
(날짜를 알 수 없거나 관련이 없는 경우, 예를 들어 "유체역학"의 경우, 주목할 만한 등장 시기를 대략적으로 추정하여 제공합니다.)
고화질 이미지 및 다운로드는 등록된 회원에게만 100% 무료로 제공됩니다.
> 로그인 <