您必须使用原始数据作为观测值的 K 均值聚类的输入。每一行都包含单个项目或对象的测量值。必须有两个或更多数字列,且每列代表不同的测量值。使用此过程之前,必须从工作表中删除含缺失数据的行。
要使用数据列初始化聚类过程,必须有一列包含每个观测值的聚类成员值。初始化列必须包含正的连续整数或零(它不能只包含零)。最初,会将每个观测值指定给由此列中的对应值标识的聚类。初始为零表示最初未将观测值指定给组。初始分割列中的不同正整数的数量等于最终分割中的聚类数量。