【可决系数计算公式是什么】在统计学中,可决系数(R²)是一个重要的指标,用于衡量回归模型对因变量变异的解释程度。它反映了自变量与因变量之间的关系强度,是评估回归模型拟合优度的重要工具。
一、什么是可决系数?
可决系数(R²)又称为决定系数,是通过比较回归平方和(SSR)与总平方和(SST)的比例来计算的。它的取值范围在0到1之间,数值越大,说明模型对数据的拟合越好。
- R² = SSR / SST
- 其中:
- SSR(回归平方和)= Σ(ŷ_i - ȳ)²
- SST(总平方和)= Σ(y_i - ȳ)²
- 残差平方和(SSE)= Σ(y_i - ŷ_i)²
也可以用以下方式表达:
- R² = 1 - (SSE / SST)
二、可决系数的计算步骤
步骤 | 内容 |
1 | 收集数据,包括因变量 y 和自变量 x 的观测值 |
2 | 建立回归模型,计算预测值 ŷ_i |
3 | 计算每个观测值的均值 ȳ |
4 | 计算总平方和(SST) |
5 | 计算回归平方和(SSR) |
6 | 计算残差平方和(SSE) |
7 | 代入公式 R² = SSR / SST 或 R² = 1 - SSE/SST |
三、可决系数的意义
- R² = 1:表示模型完美拟合数据,所有点都落在回归线上。
- R² = 0:表示模型无法解释因变量的任何变化。
- 0 < R² < 1:表示模型能够部分解释因变量的变化。
需要注意的是,R²虽然能反映模型的拟合程度,但并不能完全说明模型的准确性或因果关系。高R²并不一定意味着模型是合理的,还需结合其他统计指标(如调整R²、F检验等)进行综合判断。
四、总结
可决系数(R²)是衡量回归模型对因变量解释能力的一个关键指标,其计算基于总平方和与回归平方和的比例。通过了解R²的含义和计算方法,可以更好地评估模型的效果,并为后续分析提供依据。
指标 | 含义 | 公式 |
R² | 可决系数 | R² = SSR / SST 或 R² = 1 - SSE/SST |
SSR | 回归平方和 | SSR = Σ(ŷ_i - ȳ)² |
SST | 总平方和 | SST = Σ(y_i - ȳ)² |
SSE | 残差平方和 | SSE = Σ(y_i - ŷ_i)² |