学习统计入门课程的学生参与了一个简单试验。每个学生都记录了他们的身高、体重、性别、抽烟喜好、平常运动量和正常脉搏。他们全都投掷了硬币,其硬币头像朝上的学生原地跑步一分钟。然后,整个班级的学生再次记录了其脉搏。您要找出第二次脉搏的最佳预测变量。
1 打开工作表“脉搏.MTW”。
2 选择统计 > 回归 > 回归 > 拟合回归模型。
3 在响应中,输入脉搏2。
4 在连续预测变量中,输入脉搏1 跑步-体重。
5 单击逐步。
6 在方法下选择逐步。
7 选中显示模型选择详细信息表并选择包括每一步的详细信息。
8 在每个对话框中单击确定。
会话窗口输出
回归分析: 脉搏 2 与 脉搏 1, 跑步, 抽烟, 性别, 高度, 体重
项的逐步选择法
候选项: 脉搏 1, 跑步, 抽烟, 性别, 高度, 体重
----步骤 1---- -----步骤 2---- -----步骤 3---- 系数 P 系数 P 系数 P 常量 10.28 44.48 42.62 脉搏 1 0.957 0.000 0.9125 0.000 0.8122 0.000 跑步 -19.12 0.000 -20.07 0.000 性别 7.75 0.000
S 13.5375 9.82193 9.17509 R-sq 37.97% 67.71% 72.14% R-sq(调整) 37.28% 66.98% 71.19% R-sq(预测) 35.12% 65.01% 69.18% Mallows 的 Cp 103.22 13.54 1.88
入选用 α = 0.15, 删除用 α = 0.15
方差分析
来源 自由度 Adj SS Adj MS F 值 P 值 回归 3 19182.0 6393.98 75.95 0.000 脉搏 1 1 6631.7 6631.66 78.78 0.000 跑步 1 8569.0 8568.95 101.79 0.000 性别 1 1177.8 1177.80 13.99 0.000 误差 88 7408.0 84.18 失拟 87 7400.0 85.06 10.63 0.240 纯误差 1 8.0 8.00 合计 91 26590.0
模型汇总
R-sq(调 S R-sq 整) R-sq(预测) 9.17509 72.14% 71.19% 69.18%
系数
方差膨 项 系数 系数标准误 T 值 P 值 胀因子 常量 42.62 7.36 5.79 0.000 脉搏 1 0.8122 0.0915 8.88 0.000 1.10 跑步 -20.07 1.99 -10.09 0.000 1.02 性别 7.75 2.07 3.74 0.000 1.11
回归方程
脉搏 2 = 42.62 + 0.8122 脉搏 1 - 20.07 跑步 + 7.75 性别
异常观测值的拟合和诊断
观测值 脉搏 2 拟合值 残差 标准残差 10 118.00 92.03 25.97 2.88 R 13 84.00 105.02 -21.02 -2.38 R 16 58.00 80.66 -22.66 -2.52 R 21 106.00 87.15 18.85 2.09 R 23 102.00 83.91 18.09 2.01 R 25 140.00 116.02 23.98 2.73 R 30 112.00 93.28 18.72 2.11 R 35 128.00 103.03 24.97 2.79 R
R 残差大 |
此示例使用了六个预测变量。在步骤 1 中,将变量“脉搏1”输入模型。在步骤 2 中,将变量“跑步”输入模型。最后在步骤 3 中,将变量“性别”输入模型。其中任何一个步骤中都没有删除变量。此时无法再输入或保留变量,因此自动过程停止。
对于每个模型,Minitab 显示常量项、系数及其在模型中每个变量的 p 值、S(MSE 的平方根)、R、调整的 R、预测的 R 和 Mallows Cp。
逐步模型选择输出旨在显示多个拟合模型的精确汇总。此表的后面是过程最终模型的完全回归输出。对于本示例,完全回归输出对应步骤 3 中的模型。
如果您需要关于解释回归模型的更多信息,请参见其他回归示例。