统计 > 多变量 > 观测值聚类
使用观测值聚类可在组最初未知的情况下将观测值分组。
此过程使用分层聚类法,该方法以所有观测值都是独立的,每个都形成自己的聚类为出发点。在第一步中,合并两个靠得最近的观测值。在下一步中,要么第三个观测值与前两个合并成一个聚类,要么其他两个观测值合并成另一个聚类。此过程将继续到所有聚类合并成一个聚类为止,不过,只剩一个聚类对于分类来说并没有什么意义。因此,您必须确定多少个组对您的数据而言是合理的,并据此进行分类。有关详细信息,请参见决定最终聚类分组。
变量或距离矩阵:输入包含测量数据的列或已存储的距离矩阵,Minitab 将对它们执行观测值分层聚类。
联结法:选择将确定如何定义两个聚类之间距离的联结法。
距离量度:选择当选择了列作为输入变量时要使用的距离度量。
标准化变量:选中此项可在计算距离矩阵之前将所有变量转换为公共尺度,方法为:减去均值并除以标准差。如果变量使用不同的单位且您想最大限度地降低尺度差异带来的影响,则这是一种很好的做法。如果标准化,则聚类质心和距离度量将位于标准化变量区间内。
指定最终分类,按
聚类数:选择此项可按指定的聚类数确定最终分割。请在框中输入此数字。请参见决定最终聚类分组。
相似性水平:选择此项可按指定的相似性水平确定最终分割。请在框中输入此值。请参见决定最终聚类分组。
显示树状图:选中此项将显示树状图或树形图,同时显示合并步骤。使用 <自定义> 可更改树状图的默认显示。