一般线性模型 (GLM)

异常观测值表 - 标准化残差

  

异常观测值表显示对一般线性模型的影响不成比例的观测值。确定这些点很重要,因为它们会产生误导结果。例如,显著的系数可能显示为不显著。

有两种类型的有影响的观测值。

·    大残差 (R):对于拟合回归线,这些点是 y 方向上的极值。绝对值大于 2 的标准化残差标记为大残差。

·    杠杆率点 (X):这些点是 x 方向上的极值。如果平均值大于 3 * 模型项数/观测值数,则会将其标记为杠杆率点。

这些情况不那么遵循建议的回归方程。但是,您可能会获得一些异常观测值。例如,根据大残差的标准,您可能会有大约 5% 的观测值将被标记为具有大残差。

对于有影响的观测值,应调查数据记录是否正确,数据收集过程是否受到其他因素的影响。要确定影响程度,您可以使用或不使用有影响的观测值拟合此模型,并比较系数、p 值、R2 和其他模型摘要值。

如果分析表明有许多异常观测值,那么该模型很可能会出现严重的失拟。也就是说,该模型不能充分说明因子与响应变量之间的关系。

输出示例

异常观测值的拟合和诊断
 
观测值    薪金  拟合值     残差  标准残差
    39  2.3000  2.5500  -0.2500     -2.40  R
    40  2.8000  2.5500   0.2500      2.40  R
 
R  残差大
                                            

解释

对于薪金数据,两个观测值 3940 都有绝对值大于 2(-2.402.40)的标准化残差。由于此研究中有 45 个观测值,因此您应该会看到两个或三个异常观测值。应对这两个观测值加以分析研究。

注意

残差图也有助于检查有关一般线性模型的假设。