顺序 Logistic 回归示例
主题
     解释结果     会话命令    另请参见 

假设您是一名生物学家,您认为在过去几年中,东北部的蝾螈成年种群已经变小。您希望确定孵化出的蝾螈的生存时间与水中毒性水平之间是否存在联系,以及是否存在地区性效应。如果生存时间 < 10 天,则编码为 1,2 为 10 到 30 天,3 为 31 到 60 天。

1    打开工作表“回归示例.MTW”。

2    选择统计 > 回归 > 顺序 Logistic 回归

3    在响应中,输入生存。在模型中,输入地区 毒性级别。在因子可选)中,输入地区

4    单击结果。选择此外,因子水平值列表和自由度大于 1 的项目检验。在每个对话框中单击确定

会话窗口输出

顺序 Logistic 回归: 生存 与 地区, 毒性级别

 

 

链接函数:Logit

 

 

响应信息

 

变量  值    计数

生存  1       15

      2       46

      3       12

      合计    73

 

 

因子信息

 

因子  水平数  值

地区       2  1, 2

 

 

Logistic 回归表

 

                                                      95% 置信区

                                                          间

自变量        系数  系数标准误      Z      P  优势比  下限  上限

常量(1)   -7.04343     1.68017  -4.19  0.000

常量(2)   -3.52273     1.47108  -2.39  0.017

地区

 2        0.201456    0.496153   0.41  0.685    1.22  0.46  3.23

毒性级别  0.121289   0.0340510   3.56  0.000    1.13  1.06  1.21

 

 

对数似然 = -59.290

检验所有斜率是否为零:G = 14.713,DF = 2,P 值 = 0.001

 

 

拟合优度检验

 

方法        卡方  自由度      P

Pearson  122.799     122  0.463

偏差     100.898     122  0.918

 

 

相关性度量:

(响应变量与预测概率之间)

 

配对    数量  百分比  度量结果综述

一致    1126    79.2  Somer 的 D             0.59

不一致   288    20.3  Goodman-Kruskal Gamma  0.59

结         8     0.6  Kendall 的 Tau-a       0.32

合计    1422   100.0

解释结果

会话窗口包含以下五部分内容:

响应信息 显示落于每个响应类别中的观测值数,以及缺失观测值数。响应值按从低到高的顺序显示。在此,我们使用默认编码方案,即按照从低到高的顺序排列值:1 为 < 10 天,2 为 10 到 30 天,3 为 31 到 60 天(请参见页面上响应变量的参考事件)。

因子信息 显示模型中所有因子、每个因子的水平数以及因子水平值。已指定为参考水平的因子水平是“值”下的第一个条目,地区 1(请参见页面上响应变量的参考事件)。

Logistic 回归表格 显示估计系数、系数的标准误、z 值p 值。使用 Logit 链接函数时,您会看到计算出的优势比以及优势比的 95% 置信区间

·    标记为 Const(1) 和 Const(2) 的值分别是 < 10 天和 10-30 天的累积生存概率的 logit 的估计截距。由于最后一个响应值的累积概率为 1,因此不需要估计 31-60 天的截距。

·    地区的系数 0.2015 是协变量“毒性级别”保持恒定,当地区为 2 与地区为 1 相比时,累积生存概率的 logit 变化的估计。由于估计系数的 p 值为 0.685,因此证据不足以断定地区对生存时间有影响。

·    每个协变量都有一个估计系数,为每个因子水平给出平行线。此处,单个协变量“毒性级别”的估计系数为 0.121,其 p 值 < 0.0005。p 值表明对于大多数 a 水平,有足够证据可以断定毒性水平影响生存。系数为正且优势比大于一,表明毒性水平越高,相关联的生存值就越低。具体地说,水的毒性提高一个单位,就会导致蝾螈生存小于或等于 10 天与大于 30 天相比和蝾螈生存小于或等于 30 天与大于 30 天相比的优势增加提高 13%.

·    接下来显示的是极大似然迭代中最后一个对数似然以及统计量 G。此统计量检验所有与预测变量关联的系数等于零对至少有一个系数不等于零的原假设。在此示例中,G = 14.713 且 p 值为 0.001,表明有足够证据断定至少有一个估计系数不等于零。

拟合优度检验显示 Pearson 和偏差拟合优度检验。在本例中,Pearson 检验的 p 值为 0.463,偏差检验的 p 值为 0.918,表明没有足够证据断定模型未与数据充分拟合。如果 p 值小于您选择的 a 水平,则检验否定模型与数据充分拟合的原假设。

相联度量 显示一致对、不一致对和约束对的数量和百分比表,以及常用秩的相关统计量。这些值度量观测响应与预测概率之间的关联度。

·    一致对和不一致对及约束对表通过将观测值与不同的响应值配对计算得出。在此,我们有 15 个 1、46 个 2 和 12 个 3,从而得到 15 x 46 + 15 x 12 + 46 x 12 = 1422 对不同的响应值。对于编码响应值最小的对(示例中的 1-2 和 1-3 值对),如果直到最小响应值(此处为 1)的累积概率大于值最小的观测值,则该对为一致对。这对于其他值对也适用。对于本示例中包含编码为 2 和 3 的响应的对,如果直到 2 的累积概率大于编码为 2 的观测值,则该对为一致对。如果情况相反,则为不一致对。如果累积概率相等,则为约束对。在本例中,对中有 79.2% 为一致对,20.3% 为不一致对,0.6% 为约束对。您可以使用这些值作为预测的比较度量。例如,您可以在评估预测变量和不同的链接函数时使用它们。

·    Somers D、Goodman-Kruskal Gamma 和 Kendall Tau-a 是一致对和不一致对表的汇总。这些数字具有相同的分子:一致对的数量减去不一致对的数量。Somer D 的分母为总对数,Goodman-Kruskal Gamma 的分母为除约束对之外的总对数,Kendall Tau-a 的分母为所有可能的观测值对数。这些度量很可能都在 0 到 1 之间,值越大,表示模型的预测能力越强。