显示描述性统计

图形 - 数据箱线图

  

箱线图汇总了有关数据的形状、离差和中心的信息。这有助于发现异常值

箱的下边缘表示下四分位数 (Q1),而上边缘表示上四分位数 (Q3)。因此,图形的箱部分表示四分位数极差 (IQR) 或观测值的中间 50% 部分。

所绘制的通过该箱的水平线表示数据的中位数

从箱扩展出去的直线称为。须向外扩展,表示数据集中(不包括异常值)的最低值和最高值。

极端值或异常值由星号 (*) 表示。

使用箱线图可以评估数据的对称性

·    如果数据刚好对称,中位线将大致位于 IQR 箱的中间,并且须的长度相近。

·    如果数据偏斜,中位线可能不在 IQR 框的中间,而且一条可能显著长于另一条。

输出示例

解释

在降雨量数据的箱线图中,中位线位于 IQR 箱中心,须长度相同。这表明除了异常值(星号)之外,数据对称。这恰好表明,异常值与样本数据的其余值可能不是来自同一总体。