您要实时诱捕、麻醉并测量一百四十三只黑熊。测量包括总长和头长(Length、Head.L)、总重和头重(Weight、Head.W)以及颈围和胸围(Neck.G、Chest.G)。您想要将这 143 只熊划分为小熊、中熊或大熊。您知道样本中的第二只、第七十八只和第十五只熊分别代表了这三个类别。首先,创建一个初始分割列,将三只种子熊指定为 1 = 小、2 = 中、3 = 大,并将其余熊指定为 0(未知),以指示初始聚类成员。然后,执行 K 均值聚类并将聚类成员存储在名为“熊的大小”的列中。
1 打开工作表“熊.MTW”。
2 要创建初始分割列,请选择计算 > 产生模板化数据 > 简单数集。
3 在将模板数据存储在中,输入初始 作为存储列名称。
4 在从第一个值和至最后一个值中,输入 0。
5 在列出各项值中,输入 143。单击确定。
6 转至数据窗口,并在名为初始 列的第二行、第七十八行和第十五行中分别输入 1、2 和 3。
7 选择统计 > 多变量 > K 均值聚类。
8 在变量中,输入 '头长'-'重量'。
9 在指定分割,按下,选择初始分割列,然后输入初始。
10 选中标准化变量。
11 单击存储。在聚类成员列中,输入熊的大小。
12 在每个对话框中单击确定。
会话窗口输出
K 均值聚类分析: 头长, 头宽, 颈围, 长度, 胸围, 体重
标准化变量
最终分割
点群数 3
观测值 到质心的 到质心的 个数 类内平方和 平均距离 最大距离 聚类1 41 63.075 1.125 2.488 聚类2 67 78.947 0.997 2.048 聚类3 35 65.149 1.311 2.449
聚类质心
变量 聚类1 聚类2 聚类3 总质心 头长 -1.0673 0.0126 1.2261 -0.0000 头宽 -0.9943 -0.0155 1.1943 0.0000 颈围 -1.0244 -0.1293 1.4476 -0.0000 长度 -1.1399 0.0614 1.2177 0.0000 胸围 -1.0570 -0.0810 1.3932 -0.0000 体重 -0.9460 -0.2033 1.4974 -0.0000
聚类质心之间的距离
聚类1 聚类2 聚类3 聚类1 0.0000 2.4233 5.8045 聚类2 2.4233 0.0000 3.4388 聚类3 5.8045 3.4388 0.0000 |
K 均值聚类将 143 只熊划分为 41 只小熊、67 只中熊和 35 只大熊。Minitab 在第一个表中显示每个聚类中的观测值数、聚类内平方和、观测值与聚类质心的平均距离以及观测值与聚类质心的最大距离。一般而言,平方和较小的聚类比平方和较大的聚类更紧凑。质心是该聚类中观测值的变量均值的向量,用作聚类中点。
单个聚类的质心显示在第二个表中,而第三个表中给出了聚类质心之间的距离。
“熊的大小”列包含聚类指定。