为了控制对大麻哈鱼的捕捞,需要识别鱼的产地是阿拉斯加还是加拿大。从每个来源地各捕获了五十条鱼,并且分别对它们生活在淡水中时和随后生活在咸水中时的生长轮直径进行了测量。目的是为了能够识别新捕获的鱼是来自阿拉斯加鱼群还是加拿大鱼群。该示例和数据来自 [6],第 519-520 页。
1 打开工作表“多元分析示例.MTW”。
2 选择统计 > 多变量 > 判别分析。
3 在组中,输入大麻哈鱼产地。
4 在自变量中,输入淡水 海洋。单击确定。
会话窗口输出
判别分析: 大麻哈鱼产地 与 淡水, 海洋
响应的响应的线性判别法: 大麻哈鱼产地
预测变量: 淡水, 海洋
组 阿拉斯加 加拿大 计数 50 50
分类汇总
实际组 置入组 阿拉斯加 加拿大 阿拉斯加 44 1 加拿大 6 49 合计 N 50 50 正确 N 44 49 比率 0.880 0.980
N = 100 正确 N = 93 正确比率 = 0.930
组之间的平方距离
阿拉斯加 加拿大 阿拉斯加 0.00000 8.29187 加拿大 8.29187 0.00000
组的线性判别函数
阿拉斯加 加拿大 常量 -100.68 -95.14 淡水 0.37 0.50 海洋 0.38 0.33
误分类观测值的汇总
观测值 实际组 预测组 组 平方距离 概率 1** 阿拉斯加 加拿大 阿拉斯加 3.544 0.428 加拿大 2.960 0.572 2** 阿拉斯加 加拿大 阿拉斯加 8.1131 0.019 加拿大 0.2729 0.981 12** 阿拉斯加 加拿大 阿拉斯加 4.7470 0.118 加拿大 0.7270 0.882 13** 阿拉斯加 加拿大 阿拉斯加 4.7470 0.118 加拿大 0.7270 0.882 30** 阿拉斯加 加拿大 阿拉斯加 3.230 0.289 加拿大 1.429 0.711 32** 阿拉斯加 加拿大 阿拉斯加 2.271 0.464 加拿大 1.985 0.536 71** 加拿大 阿拉斯加 阿拉斯加 2.045 0.948 加拿大 7.849 0.052 |
如“分类摘要”表中所示,尽管将阿拉斯加鱼正确归类的概率(44/50,即 88%)比将加拿大鱼正确归类的概率(49/50,即 98%)低,但判别分析正确识别了 100 条鱼中的 93 条。要识别新捕获的鱼,可以计算与阿拉斯加鱼和加拿大鱼相关联的线性判别函数,并根据哪个判别函数值较大将新捕捞的鱼确定为属于某个特定来源。为此,可以使用计算 > 计算器计算存储值或输出值,也可以再次执行判别分析并预测新观测值的组成员。
“误分类观测值摘要”表显示了从每个误分类点到组质心的平方距离和后验概率。平方距离值是从观测值到组质心或均值向量的距离值。概率值是后验概率。观测值被分配给后验概率最高的组。