fbpx
维基百科

68–95–99.7法則

統計上,68–95–99.7法則(68–95–99.7 rule)是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。若用數學用語表示,其算式如下,其中X為常態分布隨機變數的觀測值,μ為分佈的平均值,而σ為標準差:

正態分佈下,和平均值偏離一個標準差以內的數據會佔68.27%,偏離二個標準差以內的數據會到95.45%,偏離三個標準差以內的數據會到99.73%。
x軸為標準分數,y軸是比標準分數接近平均值之內的比例。y軸是對數長度

在實驗科學中有對應正態分佈的三西格馬法則(three-sigma rule of thumb),是一個簡單的推論,內容是「幾乎所有」的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的機率視為「幾乎一定」[1]。不過上述推論是否有效,會視探討領域中「顯著」的定義而定,在不同領域,「顯著」(significant)的定義也隨著不同,例如在社會科學中,若置信区间是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現英语Discovery (observation)新的粒子,置信区间要到正負五個標準差(99.99994%)的程度。

在不是正態分佈的情形下,也有另一個對應的三西格馬法則(three-sigma rule),即使是在非正態分佈的情形下,至少會有88.8%的機率會在正負三個標準差的範圍內,這是依照切比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的機率至少有95%,若一些符合特定條件的分佈,機率至少會到98%[2]

數值表 编辑

由于正态分布含有指数项的特性,超出某个标准差范围的概率会随着该范围的扩大而大幅减小。假如某实验每天进行一次,则实验结果超出某标准差范围的频率可列为下表:

範圍 預期的样本比例在範圍內 近似預期頻率超出範圍 近似頻率(假设每天实验一次)
μ ± 0.5σ 0.382924922548026 3次中发生2次 每星期四至五次
μ ± σ 0.682689492137086[3] 3次中发生1次 每星期兩次
μ ± 1.5σ 0.866385597462284 7次中发生1次 每星期
μ ± 2σ 0.954499736103642[4] 22次中发生1次 每三個星期
μ ± 2.5σ 0.987580669348448 81次中发生1次 每三个月
μ ± 3σ 0.997300203936740[5] 370次中发生1次 每年
μ ± 3.5σ 0.999534741841929 2 149次中发生1次 每六年
μ ± 4σ 0.999936657516334 15 787次中发生1次 每43 年(约一生两次)
μ ± 4.5σ 0.999993204653751 147160次中发生1次 每403 年(近代以来仅1次)
μ ± 5σ 0.999999426696856 1744278次中发生1次 4776年(人类记录历史以来仅1次)
μ ± 5.5σ 0.999999962020875 26330254次中发生1次 72090年(智人出现以来仅4次)
μ ± 6σ 0.999999998026825 506797346次中发生1次 每138萬年(直立人出现以来仅1-2次)
μ ± 6.5σ 0.999999999919680 12450197393次中发生1次 每3400萬年(恐龙灭绝以来仅2次)
μ ± 7σ 0.999999999997440 390682215445次中发生1次 每10.7億年(地球诞生以来仅4次)
μ ± xσ    次中发生1次  

参考文献 编辑

  1. ^ 「三西格馬法則」的用法大約是在公元2000年代時出現,有刊載在Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003: 359 Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006: 553. 
  2. ^ See:
    • Wheeler, D. J.; Chambers, D. S. Understanding Statistical Process Control. SPC Press. 1992. 
    • Czitrom, Veronica; Spagon, Patrick D. Statistical Case Studies for Industrial Process Improvement. SIAM. 1997: 342. 
    • Pukelsheim, F. The Three Sigma Rule. American Statistician. 1994, 48: 88–91. 
  3. ^ Sloane, N.J.A. (编). Sequence A178647. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  4. ^ Sloane, N.J.A. (编). Sequence A110894. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  5. ^ Sloane, N.J.A. (编). Sequence A270712. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 

参见 编辑

7法則, 在統計上, rule, 是在正態分佈中, 距平均值小於一個標準差, 二個標準差, 三個標準差以內的百分比, 更精確的數字是68, 及99, 若用數學用語表示, 其算式如下, 其中x, 為常態分布隨機變數的觀測值, 為分佈的平均值, 而σ, 為標準差, 正態分佈下, 和平均值偏離一個標準差以內的數據會佔68, 偏離二個標準差以內的數據會到95, 偏離三個標準差以內的數據會到99, x軸為標準分數, y軸是比標準分數接近平均值之內的比例, y軸是對數長度, 682689492137086, 954499736. 在統計上 68 95 99 7法則 68 95 99 7 rule 是在正態分佈中 距平均值小於一個標準差 二個標準差 三個標準差以內的百分比 更精確的數字是68 27 95 45 及99 73 若用數學用語表示 其算式如下 其中X 為常態分布隨機變數的觀測值 m 為分佈的平均值 而s 為標準差 正態分佈下 和平均值偏離一個標準差以內的數據會佔68 27 偏離二個標準差以內的數據會到95 45 偏離三個標準差以內的數據會到99 73 x軸為標準分數 y軸是比標準分數接近平均值之內的比例 y軸是對數長度 Pr m 1 s X m 1 s 0 682689492137086 Pr m 2 s X m 2 s 0 954499736103642 Pr m 3 s X m 3 s 0 997300203936740 displaystyle begin aligned Pr mu 1 sigma leq X leq mu 1 sigma amp approx 0 682689492137086 Pr mu 2 sigma leq X leq mu 2 sigma amp approx 0 954499736103642 Pr mu 3 sigma leq X leq mu 3 sigma amp approx 0 997300203936740 end aligned 在實驗科學中有對應正態分佈的三西格馬法則 three sigma rule of thumb 是一個簡單的推論 內容是 幾乎所有 的值都在平均值正負三個標準差的範圍內 也就是在實驗上可以將99 7 的機率視為 幾乎一定 1 不過上述推論是否有效 會視探討領域中 顯著 的定義而定 在不同領域 顯著 significant 的定義也隨著不同 例如在社會科學中 若置信区间是在正負二個標準差 95 的範圍 即可視為顯著 但是在粒子物理中 若是發現 英语 Discovery observation 新的粒子 置信区间要到正負五個標準差 99 99994 的程度 在不是正態分佈的情形下 也有另一個對應的三西格馬法則 three sigma rule 即使是在非正態分佈的情形下 至少會有88 8 的機率會在正負三個標準差的範圍內 這是依照切比雪夫不等式的結果 若是單模分佈 unimodal distributions 下 正負三個標準差內的機率至少有95 若一些符合特定條件的分佈 機率至少會到98 2 數值表 编辑由于正态分布含有指数项的特性 超出某个标准差范围的概率会随着该范围的扩大而大幅减小 假如某实验每天进行一次 则实验结果超出某标准差范围的频率可列为下表 範圍 預期的样本比例在範圍內 近似預期頻率超出範圍 近似頻率 假设每天实验一次 m 0 5s 0 382924 922 548 026 3次中发生2次 每星期四至五次m s 0 682689 492 137 086 3 3次中发生1次 每星期兩次m 1 5s 0 866385 597 462 284 7次中发生1次 每星期m 2s 0 954499 736 103 642 4 22次中发生1次 每三個星期m 2 5s 0 987580 669 348 448 81次中发生1次 每三个月m 3s 0 997300 203 936 740 5 370次中发生1次 每年m 3 5s 0 999534 741 841 929 2 149次中发生1次 每六年m 4s 0 999936 657 516 334 15 787次中发生1次 每43 年 约一生两次 m 4 5s 0 999993 204 653 751 7005147160000000000 147160 次中发生1次 每403 年 近代以来仅1次 m 5s 0 999999 426 696 856 7006174427800000000 1744 278 次中发生1次 每7003477600000000000 4776 年 人类记录历史以来仅1次 m 5 5s 0 999999 962 020 875 7007263302540000000 26330 254 次中发生1次 每7004720900000000000 72090 年 智人出现以来仅4次 m 6s 0 999999 998 026 825 7008506797346000000 506797 346 次中发生1次 每138萬年 直立人出现以来仅1 2次 m 6 5s 0 999999 999 919 680 7010124501973930000 12450 197 393 次中发生1次 每3400萬年 恐龙灭绝以来仅2次 m 7s 0 999999 999 997 440 7011390682215445000 390682 215 445 次中发生1次 每10 7億年 地球诞生以来仅4次 m x s erf x 2 displaystyle operatorname erf left frac x sqrt 2 right nbsp 1 1 erf x 2 displaystyle tfrac 1 1 operatorname erf left frac x sqrt 2 right nbsp 次中发生1次 每1 1 erf x 2 displaystyle tfrac 1 1 operatorname erf left frac x sqrt 2 right nbsp 天参考文献 编辑 三西格馬法則 的用法大約是在公元2000年代時出現 有刊載在Schaum s Outline of Business Statistics McGraw Hill Professional 2003 359 及Grafarend Erik W Linear and Nonlinear Models Fixed Effects Random Effects and Mixed Models Walter de Gruyter 2006 553 上 See Wheeler D J Chambers D S Understanding Statistical Process Control SPC Press 1992 Czitrom Veronica Spagon Patrick D Statistical Case Studies for Industrial Process Improvement SIAM 1997 342 Pukelsheim F The Three Sigma Rule American Statistician 1994 48 88 91 Sloane N J A 编 Sequence A178647 The On Line Encyclopedia of Integer Sequences OEIS Foundation Sloane N J A 编 Sequence A110894 The On Line Encyclopedia of Integer Sequences OEIS Foundation Sloane N J A 编 Sequence A270712 The On Line Encyclopedia of Integer Sequences OEIS Foundation 参见 编辑 nbsp 统计学主题 P值 西格玛等级 標準分數 t 統計 英语 t statistic 取自 https zh wikipedia org w index php title 68 95 99 7法則 amp oldid 79942064, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。