名义 logistic 回归示例
主题
     解释结果     会话命令    另请参见 

假设您是一所小学的教务主任,关注孩子们认为哪个科目是他们更喜欢的科目,以及这与他们的年龄或采用的教育方法之间的联系。13 个 10 岁到 13 岁的儿童接受采用讲课或讨论方式的自然科学、数学和语言艺术等科目的课堂式教学。在学年结束时,令其确认其最喜欢的科目。我们使用名义 logistic 回归,因为响是为类别响应,而且没有隐含的类别顺序。

1    打开工作表“回归示例.MTW”。

2    选择统计 > 回归 > 名义 Logistic 回归

3    在响应中,输入科目。在模型中,输入教育方法 年龄。在因子可选)中,输入教育方法

4    单击结果。选择此外,因子水平值列表和自由度大于 1 的项目检验。在每个对话框中单击确定

会话窗口输出

名义 Logistic 回归: 观察对象 与 教育方法, 年龄

 

 

响应信息

 

变量      值        计数

观察对象  自然科学    10  (参考事件)

          数学        11

          艺术         9

          合计        30

 

 

因子信息

 

因子      水平数  值

教育方法       2  讨论, 演讲

 

 

Logistic 回归表

 

                                                                      95% 置信区间

自变量                        系数  系数标准误      Z      P  优势比  下限    上限

Logit 1:(数学/自然科学)

常量                      -1.12266     4.56425  -0.25  0.806

教育方法

 演讲                    -0.563115    0.937591  -0.60  0.548    0.57  0.09    3.58

年龄                      0.124674    0.401079   0.31  0.756    1.13  0.52    2.49

Logit 2:(艺术/自然科学)

常量                      -13.8485     7.24256  -1.91  0.056

教育方法

 演讲                      2.76992     1.37209   2.02  0.044   15.96  1.08  234.90

年龄                       1.01354    0.584494   1.73  0.083    2.76  0.88    8.66

 

 

对数似然 = -26.446

检验所有斜率是否为零:G = 12.825,DF = 4,P 值 = 0.012

 

 

拟合优度检验

 

方法        卡方  自由度      P

Pearson  6.95295      10  0.730

偏差     7.88622      10  0.640

解释结果

会话窗口输出包含以下五部分内容:

响应信息显示落于每个响应类别(自然科学、数学和语言艺术)中的观测值数,以及缺失观测值数。已指定为参考事件的响应值是“值”下的第一个条目。在本例中,默认编码方案使用反向字母顺序,定义自然科学作为参考事件。

因子信息显示模型中所有因子、每个因子的水平数以及因子水平值。已指定为参考水平的因子水平是“值”下的第一个条目。在本例中,默认编码方案使用字母顺序,定义参考水平为讨论。

Logistic 回归表显示估计系数(参数估计)、系数的标准误、z 值p 值。您还能看到优势比以及优势比的 95% 置信区间。与预测变量关联的系数是假设所有其他所有因子和协变量相同的情况下,预测变量每单位变化时 logit 中变化的估计。

·    如果有 k 个可区分的响应值,则 Minitab 估计 k-1 组参数估计,此处标记为 Logit(1) 和 Logit(2)。这些值是数学和语言艺术分别与作为参考事件的自然科学相比时对数优势或 logit 中差异的估计。每组包含一个常量和因子系数(此处为教育方法)以及协变量(此处为年龄)。“教育方法”系数是“年龄”保持恒定的情况下,教育方法为讲课与教育方法为讨论相比时 logit 中变化的估计。“年龄”系数是教育方法保持恒定的情况下,年龄增大一岁时 logit 变化的估计。这些组参数估计所得到的响应值线不平行。

·    第一组估计 logit 标记为 Logit(1),是数学相对于参考事件(自然科学)的 logit 中变化的参数估计。教育方法和年龄的 p 值分别为 0.548 和 0.756,表明证据不足以断定教育方法从讨论变为讲课的变化或年龄的变化影响了与自然科学相比对数学作为喜爱科目的选择。

·    第二组估计 logit 标记为 Logit(2),是语言艺术相对于参考事件(自然科学)的 logit 中变化的参数估计。教育方法和年龄的 p 值分别为 0.044 和 0.083,表明有证据足以(如果 p 值小于可接受的 a 水平)断定教育方法从讨论变为讲课的变化或年龄的变化影响了与自然科学相比对语言艺术作为喜爱科目的选择。教育方法的系数为正,表明采用讲课方式教学的学生比采用讨论方式教学的学生喜爱语言艺术胜过自然科学。估计优势比为 15.96,表明当教育方法从讨论变为讲课后,这些学生选择语言科学与自然科学的优势比大约为 16 倍。与年龄关联的系数为正,表明随着年龄的增长,学生们倾向于喜爱语言艺术胜过自然科学。

接下来显示的是极大似然迭代中最后一个对数似然以及统计量 G。G 是 Logistic 回归中仅显示常量项和拟合模型的模型中 - 2 对数似然中的差异。G 是用于检验与预测变量关联的所有系数等于零对这些系数不都为零的原假设的检验统计量。G = 12.825 且 p 值为 0.012 表明当 a = 0.05 时,有证据足以证明至少有一个系数不为 0。

拟合优度检验显示 Pearson 和偏差拟合优度检验。在我们的示例中,Pearson 检验的 p 值为 0.730,偏差检验的 p 值为 0.640,表明有证据证明模型与数据拟合。如果 p 值小于您所选择的 a 水平,则检验将表明模型与数据不拟合。