S、R、调整的 R 和预测的 R 是模型对数据的拟合优度的度量。这些值有助于您选择具有最佳拟合的模型。
· S 以响应变量的单位进行度量,它表示数据值偏离回归线的标准距离。对于给定研究,等式预测响应的效果越好,S 越小。
· R(R 平方)描述在观测的响应值中由预测变量解释的变异量。R 始终随预测变量的增加而增大。例如,最佳的五预测变量模型的 R 始终比最佳的四预测变量模型的高。因此,比较相同大小的模型时 R 最有效。
· 调整的 R 表示已根据模型中的项数调整的修正 R。如果包括了不必要的项,R 会人为地变得很高。与 R 不同,调整的 R 在您向模型中添加项时可能变小。使用调整的 R 比较预测变量数不同的各个模型。
· R2(预测的)表示模型对新观测值预测响应的好坏程度的度量。预测的 R2 与其他两个 R2 统计量之间的较大差异表明该模型过度拟合。过度拟合模型并不能像拟合现有数据的模型那样准确地预测新观测值。在比较模型方面,预测的 R2 比调整的 R2 更有用,因为它是用模型计算中未包括的观测值计算得出的。
输出示例 |
|
模型汇总
R-sq(调
S R-sq 整) R-sq(预测)
0.147504 94.61% 92.81% 88.01%
|
解释 |
|
对于薪金数据,S 为 0.147504,R 为 94.61%,调整的 R 为 92.81%。R(预测的)为 88.01%,表示在将模型用于预测时,模型可以解释薪金中 88.01% 的变异。如果要比较不同的薪金模型,则通常要查找可使 S 最小化并使 R 值最大化的模型。