具有连续预测变量和类别预测变量的多项式回归示例
主题
     解释结果     会话命令    
另请参见 

一家计算机制造公司的工程师希望了解塑料强度与作为预测变量的温度和制造商之间的关系。他怀疑温度和强度之间存在二次关系, 而且还希望检验制造商与温度之间的交互作用。他从制造商 A 处收集了 14 个塑料样本,并从制造商 B 处收集了 13 个样本。该工程师对这些样本分别施加不同的温度,然后测量塑料的强度。

1    打开工作表“塑料.MTW”。

2    选择统计 > 回归 > 回归 > 拟合回归模型

3    在响应中,输入强度

4    连续预测变量中,输入温度

5    类别预测变量下,输入制造商

6    单击模型

7    预测变量下,选择温度制造商

8    交互作用的阶数中,选择 2 并单击添加

9    预测变量下选择温度

10   项的阶数中,选择 2 并单击添加

11   单击确定

12   单击图形

13   残差图下,选择标准化

14   残差图下,选择四合一

15   在每个对话框中单击确定

会话窗口输出

回归分析: 强度 与 温度, 制造商

 

 

方法

 

类别预测变量编码  (1, 0)

 

 

方差分析

 

来源           自由度  Adj SS   Adj MS   F 值   P 值

回归                4  276060  69015.1  58.28  0.000

  温度              1   22256  22255.9  18.79  0.000

  制造商            1      21     21.2   0.02  0.895

  温度*温度         1   22581  22580.8  19.07  0.000

  温度*制造商       1      21     20.6   0.02  0.896

误差               22   26054   1184.3

  失拟             17   22644   1332.0   1.95  0.237

  纯误差            5    3411    682.1

合计               26  302115

 

 

模型汇总

 

                 R-sq(调

      S    R-sq      整)  R-sq(预测)

34.4134  91.38%    89.81%      86.31%

 

 

系数

 

                     系数标

项             系数    准误   T 值   P 值  方差膨胀因子

常量         -39905   10470  -3.81  0.001

温度            472     109   4.34  0.000      12400.05

制造商

  B            -152    1136  -0.13  0.895       7350.60

温度*温度    -1.234   0.283  -4.37  0.000      12866.50

温度*制造商

  B            0.76    5.75   0.13  0.896       7636.31

 

 

回归方程

 

制造商

A       强度 = -39905 + 472 温度 - 1.234 温度*温度

 

B       强度 = -40057 + 473 温度 - 1.234 温度*温度

 

 

异常观测值的拟合和诊断

 

观测值    强度  拟合值   残差  标准残差

    27  4760.0  4836.6  -76.6     -2.62  R

 

R  残差大

图形窗口输出

解释结果

会话窗口输出

Minitab 显示两个回归方程,每个“制造商”类别预测变量水平对应一个回归方程。您可以使用这两个方程预测特定的温度值。

方差分析表表明, 温度和塑料强度之间存在显著的二次关系 (P = 0.000)。

VIF 非常高。超过 5-10 的 VIF 值说明,由于严重的多重共线性,回归系数的估计效果较差。

在此情况下,由于更高阶项的原因,VIF 非常高。由于更高阶项包含主效应项,因而它们与主效应项相关。为减少 VIF,可以通过编码子对话框中的一个标准化预测变量选项减去均值来拟合模型。

R-Sq 值显示,回归模型解释了强度中 91.38% 的方差,表明该模型与数据拟合得很好。R-Sq(预测)为 86.31%。

观测值 27 被标识为异常观测值。这就证明这个观测值是一个异常值。请参见检查模型识别异常值选择残差类型

图形窗口输出

直方图显示数据中的一个潜在异常值。

正态概率图显示了一个与正态分布一致的近似线性的模式。

残差与拟合值图显示随机模式,表明残差具有恒定方差。有关非恒定方差的信息,请参见 [11]。此图中还显示了一个潜在的异常值。

残差与顺序图显示数据收集的顺序,可以用来发现非随机误差,特别是与时间相关的效应。残差与顺序图没有显示任何样式。