决定聚类的最终分组
主题
     

聚类的最终分组(也称为最终分割)是指将按观测值或变量是否具有共同特征来确定组别的聚类分组。有关最终分组的决定又称为切割树状图。完整的树状图(树形图)是将观测值或变量合并为一个聚类的过程的图形化描述。切割树状图类似于在树状图中画线指定最终分组。

如何知道从何处切割树状图呢?您可以首先在不指定最终分割的情况下进行聚类分析。在会话窗口结果中和树状图中检查相似性和距离水平。通过将鼠标指针放在树状图中的水平线上,可以查看相似性水平。任何步阶的相似性水平都是该步阶的最小距离相对于数据中观测值间最大距离的百分比。相似性或距离值随步阶变化的模式可以帮助您选择最终分组。值发生急剧变化的步阶可能是切割树状图的合适点,前提是这对您的数据有意义。

选择要进行分割的位置后,重新运行聚类过程,并使用聚类数相似性水平给出设定的组数或相似性水平以切割树状图。检查最终分割中生成的聚类,以确定分组是否合理。通过查看不同最终分组的树状图,还可以帮助您决定对数据最有意义的分组。

注意

对于一些数据集,平均法、质心法、中位数法和离差平方和法可能不会生成分层树状图。也就是说,合并距离并非总是在每个步阶都会增加。在树状图中,这种步阶产生的合并将会向下而不是向上。