fbpx
维基百科

68–95–99.7法則

統計上,68–95–99.7法則(68–95–99.7 rule)是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。若用數學用語表示,其算式如下,其中X為常態分布隨機變數的觀測值,μ為分佈的平均值,而σ為標準差:

正態分佈下,和平均值偏離一個標準差以內的數據會佔68.27%,偏離二個標準差以內的數據會到95.45%,偏離三個標準差以內的數據會到99.73%。
x軸為標準分數,y軸是比標準分數接近平均值之內的比例。y軸是對數長度

在實驗科學中有對應正態分佈的三西格馬法則(three-sigma rule of thumb),是一個簡單的推論,內容是「幾乎所有」的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的機率視為「幾乎一定」[1]。不過上述推論是否有效,會視探討領域中「顯著」的定義而定,在不同領域,「顯著」(significant)的定義也隨著不同,例如在社會科學中,若置信区间是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現英语Discovery (observation)新的粒子,置信区间要到正負五個標準差(99.99994%)的程度。

在不是正態分佈的情形下,也有另一個對應的三西格馬法則(three-sigma rule),即使是在非正態分佈的情形下,至少會有88.8%的機率會在正負三個標準差的範圍內,這是依照切比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的機率至少有95%,若一些符合特定條件的分佈,機率至少會到98%[2]

數值表

由于正态分布含有指数项的特性,超出某个标准差范围的概率会随着该范围的扩大而大幅减小。假如某实验每天进行一次,则实验结果超出某标准差范围的频率可列为下表:

範圍 預期的样本比例在範圍內 近似預期頻率超出範圍 近似頻率(假设每天实验一次)
μ ± 0.5σ 0.382924922548026 3次中发生2次 每星期四至五次
μ ± σ 0.682689492137086 3次中发生1次 每星期兩次
μ ± 1.5σ 0.866385597462284 7次中发生1次 每星期
μ ± 2σ 0.954499736103642 22次中发生1次 每三個星期
μ ± 2.5σ 0.987580669348448 81次中发生1次 每三个月
μ ± 3σ 0.997300203936740 370次中发生1次 每年
μ ± 3.5σ 0.999534741841929 2 149次中发生1次 每六年
μ ± 4σ 0.999936657516334 15 787次中发生1次 每43 年(约一生两次)
μ ± 4.5σ 0.999993204653751 147160次中发生1次 每403 年(近代以来仅1次)
μ ± 5σ 0.999999426696856 1744278次中发生1次 4776年(人类记录历史以来仅1次)
μ ± 5.5σ 0.999999962020875 26330254次中发生1次 72090年(智人出现以来仅4次)
μ ± 6σ 0.999999998026825 506797346次中发生1次 每138萬年(直立人出现以来仅1-2次)
μ ± 6.5σ 0.999999999919680 12450197393次中发生1次 每3400萬年(恐龙灭绝以来仅2次)
μ ± 7σ 0.999999999997440 390682215445次中发生1次 每10.7億年(地球诞生以来仅4次)
μ ± xσ   1 in    

参考文献

  1. ^ 「三西格馬法則」的用法大約是在公元2000年代時出現,有刊載在Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003: 359 Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006: 553. 
  2. ^ See:
    • Wheeler, D. J.; Chambers, D. S. Understanding Statistical Process Control. SPC Press. 1992. 
    • Czitrom, Veronica; Spagon, Patrick D. Statistical Case Studies for Industrial Process Improvement. SIAM. 1997: 342. 
    • Pukelsheim, F. The Three Sigma Rule. American Statistician. 1994, 48: 88–91. 

参见

7法則, 在統計上, rule, 是在正態分佈中, 距平均值小於一個標準差, 二個標準差, 三個標準差以內的百分比, 更精確的數字是68, 及99, 若用數學用語表示, 其算式如下, 其中x, 為常態分布隨機變數的觀測值, 為分佈的平均值, 而σ, 為標準差, 正態分佈下, 和平均值偏離一個標準差以內的數據會佔68, 偏離二個標準差以內的數據會到95, 偏離三個標準差以內的數據會到99, x軸為標準分數, y軸是比標準分數接近平均值之內的比例, y軸是對數長度, 682689492137086, 954499736. 在統計上 68 95 99 7法則 68 95 99 7 rule 是在正態分佈中 距平均值小於一個標準差 二個標準差 三個標準差以內的百分比 更精確的數字是68 27 95 45 及99 73 若用數學用語表示 其算式如下 其中X 為常態分布隨機變數的觀測值 m 為分佈的平均值 而s 為標準差 正態分佈下 和平均值偏離一個標準差以內的數據會佔68 27 偏離二個標準差以內的數據會到95 45 偏離三個標準差以內的數據會到99 73 x軸為標準分數 y軸是比標準分數接近平均值之內的比例 y軸是對數長度 Pr m 1 s X m 1 s 0 682689492137086 Pr m 2 s X m 2 s 0 954499736103642 Pr m 3 s X m 3 s 0 997300203936740 displaystyle begin aligned Pr mu 1 sigma leq X leq mu 1 sigma amp approx 0 682689492137086 Pr mu 2 sigma leq X leq mu 2 sigma amp approx 0 954499736103642 Pr mu 3 sigma leq X leq mu 3 sigma amp approx 0 997300203936740 end aligned 在實驗科學中有對應正態分佈的三西格馬法則 three sigma rule of thumb 是一個簡單的推論 內容是 幾乎所有 的值都在平均值正負三個標準差的範圍內 也就是在實驗上可以將99 7 的機率視為 幾乎一定 1 不過上述推論是否有效 會視探討領域中 顯著 的定義而定 在不同領域 顯著 significant 的定義也隨著不同 例如在社會科學中 若置信区间是在正負二個標準差 95 的範圍 即可視為顯著 但是在粒子物理中 若是發現 英语 Discovery observation 新的粒子 置信区间要到正負五個標準差 99 99994 的程度 在不是正態分佈的情形下 也有另一個對應的三西格馬法則 three sigma rule 即使是在非正態分佈的情形下 至少會有88 8 的機率會在正負三個標準差的範圍內 這是依照切比雪夫不等式的結果 若是單模分佈 unimodal distributions 下 正負三個標準差內的機率至少有95 若一些符合特定條件的分佈 機率至少會到98 2 數值表 编辑由于正态分布含有指数项的特性 超出某个标准差范围的概率会随着该范围的扩大而大幅减小 假如某实验每天进行一次 则实验结果超出某标准差范围的频率可列为下表 範圍 預期的样本比例在範圍內 近似預期頻率超出範圍 近似頻率 假设每天实验一次 m 0 5s 0 382924 922 548 026 3次中发生2次 每星期四至五次m s 0 682689 492 137 086 3次中发生1次 每星期兩次m 1 5s 0 866385 597 462 284 7次中发生1次 每星期m 2s 0 954499 736 103 642 22次中发生1次 每三個星期m 2 5s 0 987580 669 348 448 81次中发生1次 每三个月m 3s 0 997300 203 936 740 370次中发生1次 每年m 3 5s 0 999534 741 841 929 2 149次中发生1次 每六年m 4s 0 999936 657 516 334 15 787次中发生1次 每43 年 约一生两次 m 4 5s 0 999993 204 653 751 7005147160000000000 147160 次中发生1次 每403 年 近代以来仅1次 m 5s 0 999999 426 696 856 7006174427800000000 1744 278 次中发生1次 每7003477600000000000 4776 年 人类记录历史以来仅1次 m 5 5s 0 999999 962 020 875 7007263302540000000 26330 254 次中发生1次 每7004720900000000000 72090 年 智人出现以来仅4次 m 6s 0 999999 998 026 825 7008506797346000000 506797 346 次中发生1次 每138萬年 直立人出现以来仅1 2次 m 6 5s 0 999999 999 919 680 7010124501973930000 12450 197 393 次中发生1次 每3400萬年 恐龙灭绝以来仅2次 m 7s 0 999999 999 997 440 7011390682215445000 390682 215 445 次中发生1次 每10 7億年 地球诞生以来仅4次 m x s erf x 2 displaystyle operatorname erf left frac x sqrt 2 right 1 in 1 1 erf x 2 displaystyle tfrac 1 1 operatorname erf left frac x sqrt 2 right 每1 1 erf x 2 displaystyle tfrac 1 1 operatorname erf left frac x sqrt 2 right 天参考文献 编辑 三西格馬法則 的用法大約是在公元2000年代時出現 有刊載在Schaum s Outline of Business Statistics McGraw Hill Professional 2003 359 及Grafarend Erik W Linear and Nonlinear Models Fixed Effects Random Effects and Mixed Models Walter de Gruyter 2006 553 上 See Wheeler D J Chambers D S Understanding Statistical Process Control SPC Press 1992 Czitrom Veronica Spagon Patrick D Statistical Case Studies for Industrial Process Improvement SIAM 1997 342 Pukelsheim F The Three Sigma Rule American Statistician 1994 48 88 91 参见 编辑 统计学主题 P值 西格玛等级 標準分數 t 統計 英语 t statistic 取自 https zh wikipedia org w index php title 68 95 99 7法則 amp oldid 68547938, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。