判别分析示例
主题
     解释结果     会话命令    另请参见 

为了控制对大麻哈鱼的捕捞,需要识别鱼的产地是阿拉斯加还是加拿大。从每个来源地各捕获了五十条鱼,并且分别对它们生活在淡水中时和随后生活在咸水中时的生长轮直径进行了测量。目的是为了能够识别新捕获的鱼是来自阿拉斯加鱼群还是加拿大鱼群。该示例和数据来自 [6],第 519-520 页。

1    打开工作表“多元分析示例.MTW”。

2    选择统计 > 多变量 > 判别分析

3    在中,输入大麻哈鱼产地

4    自变量中,输入淡水 海洋。单击确定

会话窗口输出

判别分析: 大麻哈鱼产地 与 淡水, 海洋

 

 

响应的响应的线性判别法: 大麻哈鱼产地

 

 

预测变量: 淡水, 海洋

 

 

组        阿拉斯加      加拿大

计数            50          50

 

 

分类汇总

 

               实际组

置入组    阿拉斯加  加拿大

阿拉斯加        44       1

加拿大           6      49

合计 N          50      50

正确 N          44      49

比率         0.880   0.980

 

N = 100           正确 N = 93           正确比率 = 0.930

 

 

组之间的平方距离

 

          阿拉斯加   加拿大

阿拉斯加   0.00000  8.29187

加拿大     8.29187  0.00000

 

 

组的线性判别函数

 

      阿拉斯加  加拿大

常量   -100.68  -95.14

淡水      0.37    0.50

海洋      0.38    0.33

 

 

误分类观测值的汇总

 

观测值      实际组    预测组        组  平方距离   概率

     1**  阿拉斯加    加拿大  阿拉斯加     3.544  0.428

                                加拿大     2.960  0.572

     2**  阿拉斯加    加拿大  阿拉斯加    8.1131  0.019

                                加拿大    0.2729  0.981

    12**  阿拉斯加    加拿大  阿拉斯加    4.7470  0.118

                                加拿大    0.7270  0.882

    13**  阿拉斯加    加拿大  阿拉斯加    4.7470  0.118

                                加拿大    0.7270  0.882

    30**  阿拉斯加    加拿大  阿拉斯加     3.230  0.289

                                加拿大     1.429  0.711

    32**  阿拉斯加    加拿大  阿拉斯加     2.271  0.464

                                加拿大     1.985  0.536

    71**    加拿大  阿拉斯加  阿拉斯加     2.045  0.948

                                加拿大     7.849  0.052

解释结果

如“分类摘要”表中所示,尽管将阿拉斯加鱼正确归类的概率(44/50,即 88%)比将加拿大鱼正确归类的概率(49/50,即 98%)低,但判别分析正确识别了 100 条鱼中的 93 条。要识别新捕获的鱼,可以计算与阿拉斯加鱼和加拿大鱼相关联的线性判别函数,并根据哪个判别函数值较大将新捕捞的鱼确定为属于某个特定来源。为此,可以使用计算 > 计算器计算存储值或输出值,也可以再次执行判别分析并预测新观测值的组成员。

“误分类观测值摘要”表显示了从每个误分类点到组质心的平方距离和后验概率。平方距离值是从观测值到组质心或均值向量的距离值。概率值是后验概率。观测值被分配给后验概率最高的组。