您要进行一项研究以确定环境变化对血压的长期影响。对象是 39 名年龄在 21 岁以上的秘鲁男性,他们从安第斯山脉迁移到海拔较低的大城镇。您记录了他们的年龄(年龄)、迁移年数(年数)、以千克计的体重(体重)、以毫米计的身高(高度)、以毫米计的下巴、前臂和小腿的皮褶厚度(下颚、前臂、小腿)、以每分钟跳动次数计的脉搏率(脉搏) 以及心脏的收缩压和舒张压(心脏收缩、心脏舒张)。
您的目标是通过按相似特征合并变量来减少变量的数目。您将变量聚类与默认的相关性距离量度(平均联结)和树状图配合使用。
1 打开工作表“秘鲁.MTW”。
2 选择统计 > 多变量 > 变量聚类。
3 在变量或距离矩阵中,输入年龄-心脏舒张。
4 对于联结法,请选择平均。
5 选中显示树状图。单击确定。
会话窗口输出
变量的聚类分析: 年龄, 年数, 体重, 高度, 下颚, 前臂, 小腿, 脉搏, 心脏收缩, 心脏舒张
相关系数距离, 类平均法 合并步骤
已合 并的 新聚类号 点群 新聚 中的观测 步骤 点群数 相似性水平 距离水平 号 类号 值个数 1 9 86.7763 0.264474 6 7 6 2 2 8 79.4106 0.411787 1 2 1 2 3 7 78.8470 0.423059 5 6 5 3 4 6 76.0682 0.478636 3 9 3 2 5 5 71.7422 0.565156 3 10 3 3 6 4 65.5459 0.689082 3 5 3 6 7 3 61.3391 0.773218 3 8 3 7 8 2 56.5958 0.868085 1 3 1 9 9 1 55.4390 0.891221 1 4 1 10 |
图形窗口输出
Minitab 在会话窗口中显示合并步骤。在每一步,会合并两个聚类。该表显示合并了哪些聚类、它们之间的距离、对应的相似性水平、新聚类的标识号(该编号始终是所合并的两个聚类的编号中的较小者)、新聚类中的变量数以及聚类数。合并过程将继续到只剩一个聚类为止。
如果请求了最终分割,则还会获得每个聚类中所包括变量的列表。
树状图以树形图的形式显示合并表中打印的信息。树状图表明可以通过平均或合计方式组合的变量。在此示例中,下巴、前臂和小腿皮褶厚度的测量值是相似的,因此您决定合并它们。年龄和迁移后年数这两个变量是相似的,但您将研究此关系。如果对象是在某个特定年龄迁移的,则这些变量可能会包含相似信息,并且可以合并。重量和两个血压测量值是相似的。您决定将重量作为独立变量保留,但将血压测量值合并为一个。