K 均值聚类示例
主题
     解释结果     会话命令    另请参见 

您要实时诱捕、麻醉并测量一百四十三只黑熊。测量包括总长和头长(Length、Head.L)、总重和头重(Weight、Head.W)以及颈围和胸围(Neck.G、Chest.G)。您想要将这 143 只熊划分为小熊、中熊或大熊。您知道样本中的第二只、第七十八只和第十五只熊分别代表了这三个类别。首先,创建一个初始分割列,将三只种子熊指定为 1 = 小、2 = 中、3 = 大,并将其余熊指定为 0(未知),以指示初始聚类成员。然后,执行 K 均值聚类并将聚类成员存储在名为“熊的大小”的列中。

1    打开工作表“熊.MTW”。

2    要创建初始分割列,请选择计算 > 产生模板化数据 > 简单数集

3    在将模板数据存储在中,输入初始 作为存储列名称。

4    从第一个值至最后一个值中,输入 0

5    列出各项值中,输入 143。单击确定

6    转至数据窗口,并在名为初始 列的第二行、第七十八行和第十五行中分别输入 123

7    选择统计 > 多变量 > K 均值聚类

8    在变量中,输入 '头长'-'重量'。

9    在指定分割,按下,选择初始分割列,然后输入初始

10  选中标准化变量

11  单击存储。在聚类成员列中,输入熊的大小

12  在每个对话框中单击确定

会话窗口输出

K 均值聚类分析: 头长, 头宽, 颈围, 长度, 胸围, 体重

 

 

标准化变量

 

 

最终分割

 

 

点群数 3

 

 

       观测值              到质心的  到质心的

         个数  类内平方和  平均距离  最大距离

聚类1      41      63.075     1.125     2.488

聚类2      67      78.947     0.997     2.048

聚类3      35      65.149     1.311     2.449

 

 

聚类质心

 

变量    聚类1    聚类2   聚类3   总质心

头长  -1.0673   0.0126  1.2261  -0.0000

头宽  -0.9943  -0.0155  1.1943   0.0000

颈围  -1.0244  -0.1293  1.4476  -0.0000

长度  -1.1399   0.0614  1.2177   0.0000

胸围  -1.0570  -0.0810  1.3932  -0.0000

体重  -0.9460  -0.2033  1.4974  -0.0000

 

 

聚类质心之间的距离

 

        聚类1   聚类2   聚类3

聚类1  0.0000  2.4233  5.8045

聚类2  2.4233  0.0000  3.4388

聚类3  5.8045  3.4388  0.0000

解释结果

K 均值聚类将 143 只熊划分为 41 只小熊、67 只中熊和 35 只大熊。Minitab 在第一个表中显示每个聚类中的观测值数、聚类内平方和、观测值与聚类质心的平均距离以及观测值与聚类质心的最大距离。一般而言,平方和较小的聚类比平方和较大的聚类更紧凑。质心是该聚类中观测值的变量均值的向量,用作聚类中点。

单个聚类的质心显示在第二个表中,而第三个表中给出了聚类质心之间的距离。

“熊的大小”列包含聚类指定。