标准差

离差的最常用度量,即数据从均值展开的程度。极差通过用最大值减去最小值来估计数据的展开,而标准差则是大致估计单个观测值到均值的“平均”距离。标准差越大,数据中的展开越大。

标准差可以用作估计过程整体变异的初步基准。例如,管理员在两家医院急诊部治疗的患者的出院时间进行跟踪。尽管平均出院时间大致相同(35 分钟),但标准差显著不同。  

 

医院 1 标准差大约为 6。平均而言,患者的出院时间大约偏离均值(蓝线)6 分钟。

 

医院 2 标准差大约为 20。平均而言,患者的出院时间大约偏离均值(蓝线)20 分钟。

标准差的计算方法是取方差(数据离差的另一个度量)的正平方根。处理标准差通常更方便和直观,因为它使用与数据相同的单位。例如,如果机器部件的重量以克为单位,则其重量的标准差也以克为单位进行计算,其方差以克2为单位进行计算。  

在正态(钟形)分布中,距离均值的连续标准差提供了用于估计数据观测值的百分比的有用基准。

 

大约 95% 的观测值落于距离均值 2 个标准差之内,如蓝色阴影区域所示。

 

大约 68% 的观测值落于距离均值 1 个标准差之内(-1 到 +1),大约 99.7% 的观测值落于均值 3 个标准差之内(-3 到 +3)。

 

 

符号 s(西格玛)通常用于表示总体的标准差,而 s 用于表示样本的标准差。

对某一过程而言不是随机或不合乎自然规律的变异通常称为噪声。