fbpx
维基百科

显著性差异

統計學假說檢定[1][2]顯著性差異(或统计学意义,英語:statistical significance)是對數據差異性的評價,當某次實驗的结果在虛無假說下不大可能发生时,就認為該結果具有顯著性差異。更準確而言,譬如某項研究設定了一個數值α(顯著水準),表示虛無假說本來正確但卻被拒絕的出錯概率[3],然後用p值表示虛無假說為真時得到某結果或比這個結果更極端的情況的概率[4]。當pα時,就可以認為結果具有統計學意義,或數據之間具有了顯著性差異。[5][6][7][8][9][10][11]顯著水準應當在開始數據收集前就設定,通常習慣設定為5%[12]或更低,因研究的具體學科領域而異。[13]

在任何涉及到从总体抽取样本实验观察性研究中,观察到的结果都有可能只不过是由抽样误差英语sampling error产生的。[14][15]但是,如果一个观察结果的p值小于(或等于)显著性水平α,研究者就可以得出“该结果能反映总体的特征”的结论[1],并拒绝零假设[16]

顯著性差異的原因可能是:

  • 參與比對的數據是來自不同實驗對象,如比-西一般能力測驗中,大學學歷被試組的成績與小學學歷被試組之間,會存在顯著性差異;
  • 也可能是因為實驗處理對實驗對象造成了改變,因而前測、後測的數據會有顯著性差異。例如,記憶術研究發現,被試者學習某記憶法前的成績,和學習記憶法後的記憶成績會有顯著性差異,則這一差異很可能來自於這種記憶法對被試記憶能力的改變。

歷史

顯著性差異的提出可追溯到18世纪,约翰·阿巴思诺特英语John Arbuthnot皮埃尔-西蒙·拉普拉斯作出了男女出生概率均等的零假设,然后计算了人类出生时性别比p值[17][18][19][20][21][22][23]

1925年,羅納德·費雪在《研究工作者的统计方法英语Statistical Methods for Research Workers》一书中提出了统计假设检验的思想,称之为“显著性检验”(tests of significance)。[24][25][26]費雪建議将1/20(=0.05)的概率作为拒绝虛無假說的一个截断值。[27]在1933年的一篇论文中,耶日·内曼埃贡·皮尔逊把这个截断值称为“显著性水平”,並賦予它符號α。他们建议,α值應當在收集任何数据收集之前提前设定。[27][28]

費雪最初將显著性水平定為0.05,但他并不打算将这一截断值定死。在他1956年出版的《统计方法与科学推断》一书中,他建议根据具体情况确定显著性水平。[27]

相關概念

显著性水平αp值的阈值,當pα時就拒絕零假设(即使零假设仍有可能是正确的)。这意味着α也是在零假设正确的情况下错误地将其否定的概率[3],称为伪阳性型一錯誤、棄真錯誤、α錯誤。

而有些研究者偏好使用置信水平γ = (1 − α)。它是零假设成立时不拒绝零假设的概率。[29][30]置信水平和置信区间是Neyman于1937年提出的。[31]

顯著水準

 
双尾检验英语one- and two-tailed tests中,显著性水平α = 0.05下的拒绝域分处在抽样分布英语sampling distribution两端的尾部,共占曲线下方面积的5%。

顯著水準significance level,符號:α)常用于假设检验中检验假设和实验结果是否一致,它代表在虛無假說(記作 )為真時,錯誤地拒絕 的機率,即發生型一錯誤(棄真錯誤、α錯誤)的機率。

比如,我們從兩個母體中分別抽取了兩組樣本數據A和B,這兩組數據在顯著水準α = 0.05下具備顯著性差異。這是說,兩組數據所代表的母體具備顯著性差異的可能性為95%;但它們代表的母體仍有5%的可能性是沒有顯著性差異的,這5%是由於抽样误差英语sampling error造成的。也可表述为:

  • 如果拒绝“两组数据一致(二者不具备显著性差异)”的零假设(接受“两组数据不一致”的备择假设),此时有5%的可能性犯第一类错误
  • 如果A=两组数据不具备显著差异;B=实际数据具有显著差异,則P(A|B) = 0.05,即統計100次,預期是B情況,但可能出現5次的A情況。

假說檢定所測得之數據之間具有顯著性差異,實驗的虛無假說就可被推翻,也就是拒絕 ,接受對立假說(alternative hypothesis,記作  );反之,若數據之間不具備顯著性差異,則拒絕對立假說,不拒絕虛無假說。通常情況下,實驗結果需要證明達到顯著水準α = 0.050.01,才可以說數據之間具備了顯著性差異,否則就如上所述,容易作出錯誤的推論。在作結論時,應確實描述方向性(例如顯著大於或顯著小於)。

数学表述为:引入p值作为检验样本(test statistic)观察值的最低顯著水準。在α = 0.01α = 0.05的条件下,若零假设成立的概率p)小于α,则表示零假设成立的情况下得到这种观测结果的概率,比1%或5%還低,在该显著性水平下,我们可拒绝该零假设。

  • P(X=x)<α=0.05为“显著(significant)”,统计分析软件SPSS中以*标记;
  • P(X=x)<α=0.01为“极显著(extremely significant)”,通常以**标记。

局限性

研究人员常常只关注他们的结果是否具有统计学意义,但其报告的结果可能并没有实质性[32],或者研究结果无法重现[33][34]。统计学意义与实际意义之间也不能等同,有统计学意义的研究未必就有实际意义。[35][36]

效应值

效应值是衡量一项研究的实际意义。[35]统计上显著的结果可能效应量很低。为了衡量结果的研究意义,研究人员最好同时给出效应值和p值。效应量量化了效应的强度,例如以标准差为单位的两个平均值之间的距离(Cohen's d)、两个变量之间的相关系数其平方,以及其他度量。[37]

再现性

统计上显著的结果未必能够轻易再现。[34]特别是一些有显著性差异的结果实际上是假阳性。重现结果每失败一次,都意味着研究结果实际上为假阳性的可能性增加。[38]

参见

参考文献

  1. ^ 1.0 1.1 Sirkin, R. Mark. Two-sample t tests. Statistics for the Social Sciences 3rd. Thousand Oaks, CA: SAGE Publications, Inc. 2005: 271–316. ISBN 978-1-412-90546-6. 
  2. ^ Borror, Connie M. Statistical decision making. The Certified Quality Engineer Handbook 3rd. Milwaukee, WI: ASQ Quality Press. 2009: 418–472. ISBN 978-0-873-89745-7. 
  3. ^ 3.0 3.1 Dalgaard, Peter. Power and the computation of sample size. Introductory Statistics with R. Statistics and Computing. New York: Springer. 2008: 155–56. ISBN 978-0-387-79053-4. doi:10.1007/978-0-387-79054-1_9. 
  4. ^ . www.dartmouth.edu. [2019-11-11]. (原始内容存档于2020-08-02). 
  5. ^ Johnson, Valen E. Revised standards for statistical evidence. Proceedings of the National Academy of Sciences. October 9, 2013, 110 (48): 19313–19317. Bibcode:2013PNAS..11019313J. PMC 3845140 . PMID 24218581. doi:10.1073/pnas.1313476110 . 
  6. ^ Redmond, Carol; Colton, Theodore. Clinical significance versus statistical significance. Biostatistics in Clinical Trials. Wiley Reference Series in Biostatistics 3rd. West Sussex, United Kingdom: John Wiley & Sons Ltd. 2001: 35–36. ISBN 978-0-471-82211-0. 
  7. ^ Cumming, Geoff. Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis. New York, USA: Routledge. 2012: 27–28. 
  8. ^ Krzywinski, Martin; Altman, Naomi. Points of significance: Significance, P values and t-tests. Nature Methods. 30 October 2013, 10 (11): 1041–1042. PMID 24344377. doi:10.1038/nmeth.2698 . 
  9. ^ Sham, Pak C.; Purcell, Shaun M. Statistical power and significance testing in large-scale genetic studies. Nature Reviews Genetics. 17 April 2014, 15 (5): 335–346. PMID 24739678. S2CID 10961123. doi:10.1038/nrg3706. 
  10. ^ Altman, Douglas G. Practical Statistics for Medical Research . New York, USA: Chapman & Hall/CRC. 1999: 167. ISBN 978-0412276309. 
  11. ^ Devore, Jay L. Probability and Statistics for Engineering and the Sciences 8th. Boston, MA: Cengage Learning. 2011: 300–344. ISBN 978-0-538-73352-6. 
  12. ^ Craparo, Robert M. Significance level. Salkind, Neil J. (编). Encyclopedia of Measurement and Statistics 3. Thousand Oaks, CA: SAGE Publications: 889–891. 2007. ISBN 978-1-412-91611-0. 
  13. ^ Sproull, Natalie L. Hypothesis testing. Handbook of Research Methods: A Guide for Practitioners and Students in the Social Science 2nd. Lanham, MD: Scarecrow Press, Inc. 2002: 49–64. ISBN 978-0-810-84486-5. 
  14. ^ Babbie, Earl R. The logic of sampling. The Practice of Social Research 13th. Belmont, CA: Cengage Learning. 2013: 185–226. ISBN 978-1-133-04979-1. 
  15. ^ Faherty, Vincent. Probability and statistical significance. Compassionate Statistics: Applied Quantitative Analysis for Social Services (With exercises and instructions in SPSS) 1st. Thousand Oaks, CA: SAGE Publications, Inc. 2008: 127–138. ISBN 978-1-412-93982-9. 
  16. ^ McKillup, Steve. Probability helps you make a decision about your results . Statistics Explained: An Introductory Guide for Life Scientists 1st. Cambridge, United Kingdom: Cambridge University Press. 2006: 44–56. ISBN 978-0-521-54316-3. 
  17. ^ Brian, Éric; Jaisson, Marie. Physico-Theology and Mathematics (1710–1794). The Descent of Human Sex Ratio at Birth. Springer Science & Business Media. 2007: 1–25. ISBN 978-1-4020-6036-6. 
  18. ^ John Arbuthnot. (PDF). Philosophical Transactions of the Royal Society of London. 1710, 27 (325–336): 186–190 [2022-06-19]. doi:10.1098/rstl.1710.0011 . (原始内容 (PDF)存档于2021-06-03). 
  19. ^ Conover, W.J., Chapter 3.4: The Sign Test, Practical Nonparametric Statistics Third, Wiley: 157–176, 1999, ISBN 978-0-471-16068-7 
  20. ^ Sprent, P., Applied Nonparametric Statistical Methods Second, Chapman & Hall, 1989, ISBN 978-0-412-44980-2 
  21. ^ Stigler, Stephen M. The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. 1986: 225–226. ISBN 978-0-67440341-3. 
  22. ^ Bellhouse, P., John Arbuthnot, in Statisticians of the Centuries by C.C. Heyde and E. Seneta, Springer: 39–42, 2001, ISBN 978-0-387-95329-8 
  23. ^ Hald, Anders, Chapter 4. Chance or Design: Tests of Significance, A History of Mathematical Statistics from 1750 to 1930, Wiley: 65, 1998 
  24. ^ Cumming, Geoff. From null hypothesis significance to testing effect sizes. Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis. Multivariate Applications Series. East Sussex, United Kingdom: Routledge. 2011: 21–52. ISBN 978-0-415-87968-2. 
  25. ^ Fisher, Ronald A. Statistical Methods for Research Workers. Edinburgh, UK: Oliver and Boyd. 1925: 43. ISBN 978-0-050-02170-5. 
  26. ^ Poletiek, Fenna H. Formal theories of testing. Hypothesis-testing Behaviour. Essays in Cognitive Psychology 1st. East Sussex, United Kingdom: Psychology Press. 2001: 29–48. ISBN 978-1-841-69159-6. 
  27. ^ 27.0 27.1 27.2 Quinn, Geoffrey R.; Keough, Michael J. Experimental Design and Data Analysis for Biologists 1st. Cambridge, UK: Cambridge University Press. 2002: 46–69. ISBN 978-0-521-00976-8. 
  28. ^ Neyman, J.; Pearson, E.S. The testing of statistical hypotheses in relation to probabilities a priori. Mathematical Proceedings of the Cambridge Philosophical Society. 1933, 29 (4): 492–510. Bibcode:1933PCPS...29..492N. doi:10.1017/S030500410001152X. 
  29. ^ "Conclusions about statistical significance are possible with the help of the confidence interval. If the confidence interval does not include the value of zero effect, it can be assumed that there is a statistically significant result." Prel, Jean-Baptist du; Hommel, Gerhard; Röhrig, Bernd; Blettner, Maria. Confidence Interval or P-Value?. Deutsches Ärzteblatt Online. 2009, 106 (19): 335–9. PMC 2689604 . PMID 19547734. doi:10.3238/arztebl.2009.0335. 
  30. ^ (PDF). [2022-06-19]. (原始内容 (PDF)存档于2020-06-21). 
  31. ^ Neyman, J. Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability. Philosophical Transactions of the Royal Society A英语Philosophical Transactions of the Royal Society A. 1937, 236 (767): 333–380. Bibcode:1937RSPTA.236..333N. JSTOR 91337. doi:10.1098/rsta.1937.0005 . 
  32. ^ Carver, Ronald P. The Case Against Statistical Significance Testing. Harvard Educational Review. 1978, 48 (3): 378–399. S2CID 16355113. doi:10.17763/haer.48.3.t490261645281841. 
  33. ^ Ioannidis, John P. A. Why most published research findings are false. PLOS Medicine. 2005, 2 (8): e124. PMC 1182327 . PMID 16060722. doi:10.1371/journal.pmed.0020124. 
  34. ^ 34.0 34.1 Amrhein, Valentin; Korner-Nievergelt, Fränzi; Roth, Tobias. The earth is flat (p > 0.05): significance thresholds and the crisis of unreplicable research. PeerJ. 2017, 5: e3544. PMC 5502092 . PMID 28698825. doi:10.7717/peerj.3544. 
  35. ^ 35.0 35.1 Hojat, Mohammadreza; Xu, Gang. A Visitor's Guide to Effect Sizes. Advances in Health Sciences Education. 2004, 9 (3): 241–9. PMID 15316274. S2CID 8045624. doi:10.1023/B:AHSE.0000038173.00909.f6. 
  36. ^ Hooper, Peter. (PDF). University of Alberta, Department of Mathematical and Statistical Sciences. [November 10, 2019]. (原始内容 (PDF)存档于2020-03-31). 
  37. ^ Pedhazur, Elazar J.; Schmelkin, Liora P. Measurement, Design, and Analysis: An Integrated Approach Student. New York, NY: Psychology Press. 1991: 180–210. ISBN 978-0-805-81063-9. 
  38. ^ Stahel, Werner. Statistical Issue in Reproducibility. Principles, Problems, Practices, and Prospects Reproducibility: Principles, Problems, Practices, and Prospects. 2016: 87–114. ISBN 9781118864975. doi:10.1002/9781118865064.ch5. 

显著性差异, 統計學的假說檢定中, 顯著性差異, 或统计学意义, 英語, statistical, significance, 是對數據差異性的評價, 當某次實驗的结果在虛無假說下不大可能发生时, 就認為該結果具有顯著性差異, 更準確而言, 譬如某項研究設定了一個數值α, 顯著水準, 表示虛無假說本來正確但卻被拒絕的出錯概率, 然後用p值表示虛無假說為真時得到某結果或比這個結果更極端的情況的概率, 當p, 就可以認為結果具有統計學意義, 或數據之間具有了顯著性差異, 顯著水準應當在開始數據收集前就設定, 通常習慣設. 統計學的假說檢定中 1 2 顯著性差異 或统计学意义 英語 statistical significance 是對數據差異性的評價 當某次實驗的结果在虛無假說下不大可能发生时 就認為該結果具有顯著性差異 更準確而言 譬如某項研究設定了一個數值a 顯著水準 表示虛無假說本來正確但卻被拒絕的出錯概率 3 然後用p值表示虛無假說為真時得到某結果或比這個結果更極端的情況的概率 4 當p a 時 就可以認為結果具有統計學意義 或數據之間具有了顯著性差異 5 6 7 8 9 10 11 顯著水準應當在開始數據收集前就設定 通常習慣設定為5 12 或更低 因研究的具體學科領域而異 13 在任何涉及到从总体中抽取样本的实验或观察性研究中 观察到的结果都有可能只不过是由抽样误差 英语 sampling error 产生的 14 15 但是 如果一个观察结果的p值小于 或等于 显著性水平a 研究者就可以得出 该结果能反映总体的特征 的结论 1 并拒绝零假设 16 顯著性差異的原因可能是 參與比對的數據是來自不同實驗對象 如比 西一般能力測驗中 大學學歷被試組的成績與小學學歷被試組之間 會存在顯著性差異 也可能是因為實驗處理對實驗對象造成了改變 因而前測 後測的數據會有顯著性差異 例如 記憶術研究發現 被試者學習某記憶法前的成績 和學習記憶法後的記憶成績會有顯著性差異 則這一差異很可能來自於這種記憶法對被試記憶能力的改變 目录 1 歷史 1 1 相關概念 2 顯著水準 3 局限性 3 1 效应值 3 2 再现性 4 参见 5 参考文献歷史 编辑顯著性差異的提出可追溯到18世纪 约翰 阿巴思诺特 英语 John Arbuthnot 和皮埃尔 西蒙 拉普拉斯作出了男女出生概率均等的零假设 然后计算了人类出生时性别比的p值 17 18 19 20 21 22 23 1925年 羅納德 費雪在 研究工作者的统计方法 英语 Statistical Methods for Research Workers 一书中提出了统计假设检验的思想 称之为 显著性检验 tests of significance 24 25 26 費雪建議将1 20 0 05 的概率作为拒绝虛無假說的一个截断值 27 在1933年的一篇论文中 耶日 内曼和埃贡 皮尔逊把这个截断值称为 显著性水平 並賦予它符號a 他们建议 a 值應當在收集任何数据收集之前提前设定 27 28 費雪最初將显著性水平定為0 05 但他并不打算将这一截断值定死 在他1956年出版的 统计方法与科学推断 一书中 他建议根据具体情况确定显著性水平 27 相關概念 编辑 显著性水平a 是p 值的阈值 當p a 時就拒絕零假设 即使零假设仍有可能是正确的 这意味着a 也是在零假设正确的情况下错误地将其否定的概率 3 称为伪阳性或型一錯誤 棄真錯誤 a錯誤 而有些研究者偏好使用置信水平g 1 a 它是零假设成立时不拒绝零假设的概率 29 30 置信水平和置信区间是Neyman于1937年提出的 31 顯著水準 编辑 在双尾检验 英语 one and two tailed tests 中 显著性水平a 0 05 下的拒绝域分处在抽样分布 英语 sampling distribution 两端的尾部 共占曲线下方面积的5 顯著水準 significance level 符號 a 常用于假设检验中检验假设和实验结果是否一致 它代表在虛無假說 記作H 0 displaystyle H 0 為真時 錯誤地拒絕H 0 displaystyle H 0 的機率 即發生型一錯誤 棄真錯誤 a錯誤 的機率 比如 我們從兩個母體中分別抽取了兩組樣本數據A和B 這兩組數據在顯著水準a 0 05 下具備顯著性差異 這是說 兩組數據所代表的母體具備顯著性差異的可能性為95 但它們代表的母體仍有5 的可能性是沒有顯著性差異的 這5 是由於抽样误差 英语 sampling error 造成的 也可表述为 如果拒绝 两组数据一致 二者不具备显著性差异 的零假设 接受 两组数据不一致 的备择假设 此时有5 的可能性犯第一类错误 如果A 两组数据不具备显著差异 B 实际数据具有显著差异 則P A B 0 05 即統計100次 預期是B情況 但可能出現5次的A情況 當假說檢定所測得之數據之間具有顯著性差異 實驗的虛無假說就可被推翻 也就是拒絕H 0 displaystyle H 0 接受對立假說 alternative hypothesis 記作H 1 displaystyle H 1 或H a displaystyle H a 反之 若數據之間不具備顯著性差異 則拒絕對立假說 不拒絕虛無假說 通常情況下 實驗結果需要證明達到顯著水準a 0 05 或0 01 才可以說數據之間具備了顯著性差異 否則就如上所述 容易作出錯誤的推論 在作結論時 應確實描述方向性 例如顯著大於或顯著小於 数学表述为 引入p值作为检验样本 test statistic 观察值的最低顯著水準 在a 0 01 或a 0 05 的条件下 若零假设成立的概率 p 小于a 则表示零假设成立的情况下得到这种观测结果的概率 比1 或5 還低 在该显著性水平下 我们可拒绝该零假设 P X x lt a 0 05为 显著 significant 统计分析软件SPSS中以 标记 P X x lt a 0 01为 极显著 extremely significant 通常以 标记 局限性 编辑研究人员常常只关注他们的结果是否具有统计学意义 但其报告的结果可能并没有实质性 32 或者研究结果无法重现 33 34 统计学意义与实际意义之间也不能等同 有统计学意义的研究未必就有实际意义 35 36 效应值 编辑 主条目 效应值 效应值是衡量一项研究的实际意义 35 统计上显著的结果可能效应量很低 为了衡量结果的研究意义 研究人员最好同时给出效应值和p值 效应量量化了效应的强度 例如以标准差为单位的两个平均值之间的距离 Cohen s d 两个变量之间的相关系数或其平方 以及其他度量 37 再现性 编辑 主条目 再现性 统计上显著的结果未必能够轻易再现 34 特别是一些有显著性差异的结果实际上是假阳性 重现结果每失败一次 都意味着研究结果实际上为假阳性的可能性增加 38 参见 编辑假說檢定 A B測試 查看别处效应 英语 Look elsewhere effect 多重比較謬誤 样本量确定 德州神槍手謬誤参考文献 编辑 1 0 1 1 Sirkin R Mark Two sample t tests Statistics for the Social Sciences 3rd Thousand Oaks CA SAGE Publications Inc 2005 271 316 ISBN 978 1 412 90546 6 Borror Connie M Statistical decision making The Certified Quality Engineer Handbook 3rd Milwaukee WI ASQ Quality Press 2009 418 472 ISBN 978 0 873 89745 7 3 0 3 1 Dalgaard Peter Power and the computation of sample size Introductory Statistics with R Statistics and Computing New York Springer 2008 155 56 ISBN 978 0 387 79053 4 doi 10 1007 978 0 387 79054 1 9 Statistical Hypothesis Testing www dartmouth edu 2019 11 11 原始内容存档于2020 08 02 Johnson Valen E Revised standards for statistical evidence Proceedings of the National Academy of Sciences October 9 2013 110 48 19313 19317 Bibcode 2013PNAS 11019313J PMC 3845140 PMID 24218581 doi 10 1073 pnas 1313476110 Redmond Carol Colton Theodore Clinical significance versus statistical significance Biostatistics in Clinical Trials Wiley Reference Series in Biostatistics 3rd West Sussex United Kingdom John Wiley amp Sons Ltd 2001 35 36 ISBN 978 0 471 82211 0 Cumming Geoff Understanding The New Statistics Effect Sizes Confidence Intervals and Meta Analysis New York USA Routledge 2012 27 28 Krzywinski Martin Altman Naomi Points of significance Significance P values and t tests Nature Methods 30 October 2013 10 11 1041 1042 PMID 24344377 doi 10 1038 nmeth 2698 Sham Pak C Purcell Shaun M Statistical power and significance testing in large scale genetic studies Nature Reviews Genetics 17 April 2014 15 5 335 346 PMID 24739678 S2CID 10961123 doi 10 1038 nrg3706 Altman Douglas G Practical Statistics for Medical Research New York USA Chapman amp Hall CRC 1999 167 ISBN 978 0412276309 含有內容需登入查看的頁面 link Devore Jay L Probability and Statistics for Engineering and the Sciences 8th Boston MA Cengage Learning 2011 300 344 ISBN 978 0 538 73352 6 Craparo Robert M Significance level Salkind Neil J 编 Encyclopedia of Measurement and Statistics 3 Thousand Oaks CA SAGE Publications 889 891 2007 ISBN 978 1 412 91611 0 Sproull Natalie L Hypothesis testing Handbook of Research Methods A Guide for Practitioners and Students in the Social Science 2nd Lanham MD Scarecrow Press Inc 2002 49 64 ISBN 978 0 810 84486 5 Babbie Earl R The logic of sampling The Practice of Social Research 13th Belmont CA Cengage Learning 2013 185 226 ISBN 978 1 133 04979 1 Faherty Vincent Probability and statistical significance Compassionate Statistics Applied Quantitative Analysis for Social Services With exercises and instructions in SPSS 1st Thousand Oaks CA SAGE Publications Inc 2008 127 138 ISBN 978 1 412 93982 9 McKillup Steve Probability helps you make a decision about your results Statistics Explained An Introductory Guide for Life Scientists 1st Cambridge United Kingdom Cambridge University Press 2006 44 56 ISBN 978 0 521 54316 3 含有內容需登入查看的頁面 link Brian Eric Jaisson Marie Physico Theology and Mathematics 1710 1794 The Descent of Human Sex Ratio at Birth Springer Science amp Business Media 2007 1 25 ISBN 978 1 4020 6036 6 John Arbuthnot An argument for Divine Providence taken from the constant regularity observed in the births of both sexes PDF Philosophical Transactions of the Royal Society of London 1710 27 325 336 186 190 2022 06 19 doi 10 1098 rstl 1710 0011 原始内容 PDF 存档于2021 06 03 Conover W J Chapter 3 4 The Sign Test Practical Nonparametric Statistics Third Wiley 157 176 1999 ISBN 978 0 471 16068 7 Sprent P Applied Nonparametric Statistical Methods Second Chapman amp Hall 1989 ISBN 978 0 412 44980 2 Stigler Stephen M The History of Statistics The Measurement of Uncertainty Before 1900 Harvard University Press 1986 225 226 ISBN 978 0 67440341 3 Bellhouse P John Arbuthnot in Statisticians of the Centuries by C C Heyde and E Seneta Springer 39 42 2001 ISBN 978 0 387 95329 8 Hald Anders Chapter 4 Chance or Design Tests of Significance A History of Mathematical Statistics from 1750 to 1930 Wiley 65 1998 Cumming Geoff From null hypothesis significance to testing effect sizes Understanding The New Statistics Effect Sizes Confidence Intervals and Meta Analysis Multivariate Applications Series East Sussex United Kingdom Routledge 2011 21 52 ISBN 978 0 415 87968 2 Fisher Ronald A Statistical Methods for Research Workers Edinburgh UK Oliver and Boyd 1925 43 ISBN 978 0 050 02170 5 Poletiek Fenna H Formal theories of testing Hypothesis testing Behaviour Essays in Cognitive Psychology 1st East Sussex United Kingdom Psychology Press 2001 29 48 ISBN 978 1 841 69159 6 27 0 27 1 27 2 Quinn Geoffrey R Keough Michael J Experimental Design and Data Analysis for Biologists 1st Cambridge UK Cambridge University Press 2002 46 69 ISBN 978 0 521 00976 8 Neyman J Pearson E S The testing of statistical hypotheses in relation to probabilities a priori Mathematical Proceedings of the Cambridge Philosophical Society 1933 29 4 492 510 Bibcode 1933PCPS 29 492N doi 10 1017 S030500410001152X Conclusions about statistical significance are possible with the help of the confidence interval If the confidence interval does not include the value of zero effect it can be assumed that there is a statistically significant result Prel Jean Baptist du Hommel Gerhard Rohrig Bernd Blettner Maria Confidence Interval or P Value Deutsches Arzteblatt Online 2009 106 19 335 9 PMC 2689604 PMID 19547734 doi 10 3238 arztebl 2009 0335 StatNews 73 Overlapping Confidence Intervals and Statistical Significance PDF 2022 06 19 原始内容 PDF 存档于2020 06 21 Neyman J Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability Philosophical Transactions of the Royal Society A 英语 Philosophical Transactions of the Royal Society A 1937 236 767 333 380 Bibcode 1937RSPTA 236 333N JSTOR 91337 doi 10 1098 rsta 1937 0005 Carver Ronald P The Case Against Statistical Significance Testing Harvard Educational Review 1978 48 3 378 399 S2CID 16355113 doi 10 17763 haer 48 3 t490261645281841 Ioannidis John P A Why most published research findings are false PLOS Medicine 2005 2 8 e124 PMC 1182327 PMID 16060722 doi 10 1371 journal pmed 0020124 34 0 34 1 Amrhein Valentin Korner Nievergelt Franzi Roth Tobias The earth is flat p gt 0 05 significance thresholds and the crisis of unreplicable research PeerJ 2017 5 e3544 PMC 5502092 PMID 28698825 doi 10 7717 peerj 3544 35 0 35 1 Hojat Mohammadreza Xu Gang A Visitor s Guide to Effect Sizes Advances in Health Sciences Education 2004 9 3 241 9 PMID 15316274 S2CID 8045624 doi 10 1023 B AHSE 0000038173 00909 f6 Hooper Peter What is P value PDF University of Alberta Department of Mathematical and Statistical Sciences November 10 2019 原始内容 PDF 存档于2020 03 31 Pedhazur Elazar J Schmelkin Liora P Measurement Design and Analysis An Integrated Approach Student New York NY Psychology Press 1991 180 210 ISBN 978 0 805 81063 9 Stahel Werner Statistical Issue in Reproducibility Principles Problems Practices and Prospects Reproducibility Principles Problems Practices and Prospects 2016 87 114 ISBN 9781118864975 doi 10 1002 9781118865064 ch5 取自 https zh wikipedia org w index php title 显著性差异 amp oldid 73117320, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。