创建散点图(使用图形 > 散点图)是评估变量之间是否存在关系以及它们存在什么类型的关系。线性关系仅仅是一种可能性。
线性关系是可以用直线建模的数据趋势。例如,假设一家航空公司想要估计燃油价格对飞行成本的影响。他们发现,一加仑航空燃料每上升一美元,他们的 LA-NYC 航班的飞行成本就增加 3500 美元。这就说明航空燃料成本与飞行成本之间存在线性关系。
图 1:强正向线性关系 |
图 2:强负向线性关系 |
两个变量同时增加或减小时,存在正线性关系。图 1 中的点紧靠线条分布,表明变量之间的关系较强。此关系的 Pearson 相关系数为 +0.921。
在一个变量增大而其他变量减小时,存在负线性关系。图 2 中的点紧靠线条分布,表明变量之间的关系较强。此关系的 Pearson 相关系数为 -0.934。
图 3:弱线性关系 |
图 4:非线性关系 |
图 3 中的数据点呈现随机分布。它们未落在靠近此线条的位置,表示存在非常弱的关系。此关系的 Pearson 相关系数为 +0.238。
图 4 显示两个变量之间存在较强的关系。但是,由于此关系不是线性的,Pearson 相关系数仅为 +0.244。这说明了为了分析可能存在的任何关系,对数据绘图非常重要的原因。
图 5:单调关系
图 5 显示两个同时增大的变量,但增速不同。此关系为单调关系,但不是线性关系。这些数据的 Pearson 相关系数为 0.843,但 Spearman 相关系数更高,为 0.948。
线性关系也是单调关系。例如,图 1 中所示的关系为单调关系和线性关系。