残差图选择
主题
Minitab 会生成残差图,它们可以用来检查模型的拟合优度。您可以选择以下残差图:
· 残差的直方图。用于显示数据一般特征的探测工具,包括:
- 典型值、展开或变异以及形状
- 数据中的异常值
图中有长尾,表明数据可能存在偏度。如果有一个或两个条形与其他条形距离较远,这些点有可能是异常值。由于直方图的外观会随用于为数据分组的区间数而改变,因此可以使用正态概率图和拟合优度检验来评估残差的正态性。
· 残差的正态概率图。如果残差呈正态分布,则此图中的点一般应该形成一条直线。如果图中的点不能形成一条直线,则正态性假设可能不成立。如果数据的观测值不足 50 个,则即使残差呈正态分布,该图也可能在尾部显示弯曲。随着观测值个数的减少,即使残差呈正态分布,该概率图也可能表现出很大的变异性和非线性。使用概率图和拟合优度检验(如 Anderson-Darling 统计量)可评估残差是否呈正态分布。
您可以在图中显示 Anderson-Darling 统计量 (AD),它能指示数据是否是正态的。如果 p 值比所选的 a 水平低,则数据将不会呈正态分布。要显示 Anderson-Darling 统计量,请选择工具 > 选项 > 线性模型 > 残差图。对于正态性的其他检验,请参见统计 > 基本统计 > 正态性检验。
· 残差与拟合值。此图应显示残差随机分布在 0 的两侧。如果有某个点远离大多数点,该点可能是异常值。而且,残差图内也不应该存在任何可识别的模式。以下情况表明可能存在非随机误差:
- 一系列递增或递减的点
- 正残差占优或负残差占优
- 一些模式,比如残差随拟合值的增加而增加
· 残差与顺序。这是一个所有残差以收集数据的顺序排列的图,可以用于找出非随机误差,特别是与时间相关的效应。相同符号的残差聚集表示正相关。连续残差的符号不断改变表示负相关。
· 四合一。选择此选项将在一个图形窗口中生成残差正态图、残差直方图、残差与拟合值图以及残差与顺序图。
· 残差与其他变量。这是所有残差相对于另一个变量的图。可相对于以下项绘制残差图:
- 每个预测变量,可查看残差的曲率或差异量值
- 从模型中去除的重要变量,可了解它们是否对响应产生其他重要影响。
如果特别关注某些残差值,可以用笔刷在图中标识它们。请参见图形笔刷。