变量聚类示例
主题
     解释结果     会话命令    另请参见 

您要进行一项研究以确定环境变化对血压的长期影响。对象是 39 名年龄在 21 岁以上的秘鲁男性,他们从安第斯山脉迁移到海拔较低的大城镇。您记录了他们的年龄(年龄)、迁移年数(年数)、以千克计的体重(体重)、以毫米计的身高(高度)、以毫米计的下巴、前臂和小腿的皮褶厚度(下颚、前臂、小腿)、以每分钟跳动次数计的脉搏率(脉搏) 以及心脏的收缩压和舒张压(心脏收缩、心脏舒张)。

您的目标是通过按相似特征合并变量来减少变量的数目。您将变量聚类与默认的相关性距离量度(平均联结)和树状图配合使用。

1    打开工作表“秘鲁.MTW”。

2    选择统计 > 多变量 > 变量聚类

3    在变量或距离矩阵中,输入年龄-心脏舒张

4    对于联结法,请选择平均

5    选中显示树状图。单击确定

会话窗口输出

变量的聚类分析: 年龄, 年数, 体重, 高度, 下颚, 前臂, 小腿, 脉搏, 心脏收缩, 心脏舒张

 

 

相关系数距离, 类平均法

合并步骤

 

 

                                     已合

                                     并的        新聚类号

                                     点群  新聚  中的观测

步骤  点群数  相似性水平  距离水平    号   类号    值个数

   1       9     86.7763  0.264474  6   7     6         2

   2       8     79.4106  0.411787  1   2     1         2

   3       7     78.8470  0.423059  5   6     5         3

   4       6     76.0682  0.478636  3   9     3         2

   5       5     71.7422  0.565156  3  10     3         3

   6       4     65.5459  0.689082  3   5     3         6

   7       3     61.3391  0.773218  3   8     3         7

   8       2     56.5958  0.868085  1   3     1         9

   9       1     55.4390  0.891221  1   4     1        10

图形窗口输出

 

解释结果

Minitab 在会话窗口中显示合并步骤。在每一步,会合并两个聚类。该表显示合并了哪些聚类、它们之间的距离、对应的相似性水平、新聚类的标识号(该编号始终是所合并的两个聚类的编号中的较小者)、新聚类中的变量数以及聚类数。合并过程将继续到只剩一个聚类为止。

如果请求了最终分割,则还会获得每个聚类中所包括变量的列表。

树状图以树形图的形式显示合并表中打印的信息。树状图表明可以通过平均或合计方式组合的变量。在此示例中,下巴、前臂和小腿皮褶厚度的测量值是相似的,因此您决定合并它们。年龄和迁移后年数这两个变量是相似的,但您将研究此关系。如果对象是在某个特定年龄迁移的,则这些变量可能会包含相似信息,并且可以合并。重量和两个血压测量值是相似的。您决定将重量作为独立变量保留,但将血压测量值合并为一个。