K 均值聚类
概述
     操作步骤     示例     数据    另请参见 

统计 > 多变量 > K 均值聚类

在组最初未知的情况下,使用观测值的 K 均值聚类(如同观测值的聚类一样)将观测值分成多个组。此过程根据 MacQueen 算法 [6] 使用观测值的非分层聚类。K 均值聚类最适用于存在足够可用信息进行有效起始聚类指定的情况。

对话框项

变量:输入包含要对其执行观测值的 K 均值非分层聚类的测量数据的列。

指定分割,按:用于为 K 均值算法指定初始分割

聚类数:选择此项可指定要形成的聚类数。例如,如果输入数字 5,则 Minitab 会使用前 5 个观测值作为初始聚类质心。每个观测值将分配给距它最近的质心的聚类。每当聚类获得或丢失观测值时,Minitab 都会重新计算聚类质心。

初始分割列:选择此项可指定包含聚类成员的列以开始分割过程。

标准化变量:选中此项可在计算距离矩阵之前将所有变量转换为公共尺度,方法为:减去均值并除以标准差。如果变量使用不同的单位且您想最大限度地降低尺度差异带来的影响,则这是一种很好的做法。如果标准化,则在计算距离矩阵之前,聚类质心和距离度量都处于标准化变量空间内。

<存储>