正态分布

以均值为中心呈对称分布的钟形曲线。正态分布是最常见的统计分布,因为许多物理、生物和社会方面的测量值都自然近似于正态。许多统计分析均要求数据来自正态分布总体。正态分布也称为 Gaussian 分布。   

例如,居住在宾夕法尼亚州的所有成年男性的身高近似于正态分布。因此,大多数男性的身高都将接近于 69 英寸的平均身高。高于和矮于 69 英寸的男性的数量相近。只有一小部分身材特别高或特别矮。

均值 (μ) 和标准差 (σ) 是定义正态分布的两种参数。均值是钟形曲线的波峰或中心。标准差决定数据的散布情况。大约有 68% 的观测值与均值相差不到 +/- 1 个标准差;95% 与均值相差不到 +/- 2 个标准差;而 99% 的观测值与均值相差不到 +/- 3 个标准差。

就宾夕法尼亚州男性的身高而言,平均身高为 69 英寸,标准差为 2.5 英寸。

大约 68% 的宾夕法尼亚男性身高介于 66.5 (m - 1s) 和 71.5 (m + 1s) 英寸之间。

大约 95% 的宾夕法尼亚男性身高介于 64 (m - 2s) 和 74 (m + 2s) 英寸之间。

大约 99% 的宾夕法尼亚男性身高介于 61.5 (m - 3s) 和 76.5 (m + 3s) 英寸之间。