|
显示描述性统计图形 - 数据箱线图 |
箱线图汇总了有关数据的形状、离差和中心的信息。这有助于发现异常值。
箱的下边缘表示下四分位数 (Q1),而上边缘表示上四分位数 (Q3)。因此,图形的箱部分表示四分位数极差 (IQR) 或观测值的中间 50% 部分。
所绘制的通过该箱的水平线表示数据的中位数。
从箱扩展出去的直线称为须。须向外扩展,表示数据集中(不包括异常值)的最低值和最高值。
极端值或异常值由星号 (*) 表示。
使用箱线图可以评估数据的对称性:
输出示例 |
解释 |
在降雨量数据的箱线图中,中位线位于 IQR 箱中心,须长度相同。这表明除了异常值(星号)之外,数据对称。这恰好表明,异常值与样本数据的其余值可能不是来自同一总体。