Product Design, Manufacturing & Innovation Resources
» 決定係数(R²)

決定係数(R²)

1900
  • Karl Pearson
オフィスで回帰モデルのデータを分析する統計学者。.

(画像はイメージです)

モデルの適合度を示す統計量で、従属変数の分散のうち独立変数から予測できる割合を表します。R² が 1 の場合は完全な適合を示し、0 の場合は線形関係がないことを示します。これは、[latex]R^2 equiv 1 – frac{SS_{res}}{SS_{tot}}[/latex] で計算されます。ここで、[latex]SS_{res}[/latex] は残差平方和です。

決定係数 R 二乗は、回帰モデルを評価するための重要な指標です。これは、結果の変動のうち、モデルによってどの程度説明されているかを直感的に示します。決定係数 R 二乗は、2 つの主要な要素から導出されます。1 つ目は、従属変数 [latex]y[/latex] の全分散を測定する総平方和 ([latex]SS_{tot} = sum_i (y_i – bar{y})^2[/latex]) です。2 つ目は、モデルによって説明されなかった分散を測定する残差平方和 ([latex]SS_{res} = sum_i (y_i – hat{y}_i)^2[/latex] で、[latex]hat{y}_i[/latex] は予測値です。

式 [latex]R^2 = 1 – SS_{res}/SS_{tot}[/latex] は、回帰モデルによって説明される全分散の割合として解釈できます。たとえば、R² が 0.75 の場合、結果の変動の 75% は、モデルの予測変数によって説明できることを意味します。単純線形回帰では、R² は、観測値と予測値の間のピアソン相関係数 (r) の二乗です。

しかし、R²には重大な制約があります。それは、たとえ新しい予測変数が無関係であっても、モデルに新しい予測変数を追加してもR²の値は決して減少しないということです。これは誤解を招きやすく、過学習を助長する可能性があります。この問題を解決するために、調整済みR二乗がよく用いられます。調整済みR二乗は、モデル内の予測変数の数を考慮してR²の値を修正し、重回帰分析における適合度のより正確な指標を提供します。

UNESCO Nomenclature: 1209
統計

タイプ

抽象システム

混乱

実質的な

使用法

広く普及している

前駆物質

  • 分散と標準偏差の概念
  • 最小二乗法
  • ピアソンの積率相関係数
  • Analysis of variance (ANOVA) principles

アプリケーション

  • 科学および工学における予測モデルの性能評価
  • 計量経済学および社会科学におけるモデル選択
  • 一連の予測変数によって説明される分散の割合を定量化する
  • リスク評価のための財務モデルの検証

特許:

NA

潜在的なイノベーションのアイデア

ボットによるトラフィック(現在1日あたり4万件以上)を排除するため、このコンテンツはコミュニティメンバー限定となっています。
> ログイン < または > 登録 < (100%無料)でこれにアクセスできます。他のすべての制限付きコンテンツとツールも同様です。

関連用語: r二乗、決定係数、適合度、モデル評価、説明分散、平方和、回帰診断、統計的有意性、調整済みr二乗、相関。

歴史的背景

決定係数(R²)

1854
1884
1896
1900
1903
1914
1924
1854
1854
1895
1899
1900
1911
1922
1925

(日付が不明または関連性がない場合、例えば「流体力学」などでは、その注目すべき出現時期の概算値が提示されます。)

関連する発明、革新、および技術原理

フルサイズの画像とダウンロードは、登録会員のみが100%無料で利用できます。