fbpx
维基百科

本福特定律

在数学中,本福特定律(英語:Benford's law)描述了真实数字数据集中首位数字的频率分布。一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近直覺得出之期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的機率就越低。它可用於檢查各種數據是否有造假。但要注意使用條件:1.數據至少3000筆以上。2.不能有人為操控。[來源請求]

數學

本福特定律說明在 進位制中,以 起頭的數出現的機率為:

 

其中 

班佛定律不但適用於個位數字,連多位的數也可用。

十進制首位數字的出現機率(%,小數點後一個位):

n     的相對大小
1 30.1% 30.1
 
2 17.6% 17.6
 
3 12.5% 12.5
 
4 9.7% 9.7
 
5 7.9% 7.9
 
6 6.7% 6.7
 
7 5.8% 5.8
 
8 5.1% 5.1
 
9 4.6% 4.6
 

不完整的解釋

一組平均增長的數據開始時,增長得較慢,由最初的數字 增長到另一個數字 起首的數的時間,必然比 起首的數增長到 ,需要更多時間,所以出現率就更高了。

從數數目來說,順序從1開始數,1,2,3,...,9,從這點終結的話,所有數起首的機會似乎相同,但9之後的兩位數10至19,以1起首的數又大大拋離了其他數了。而下一堆9起首的數出現之前,必然會經過一堆以2,3,4,...,8起首的數。若果這樣數法有個終結點,以1起首的數的出現率一般都比9大。

另一种解释如下. 当数据跨越多个数量级时,更自然的做法是画在对数坐标中,如果这些数据在对数坐标下的分布是均匀的,那么本福特定律自然成立。即使在对数坐标下的概率密度函数不是常数,只要其变化足够缓慢,且数据跨越了多个数量级,本福特定律也会近似成立,如下图所示.

 

這個定律的嚴格證明,可以參見Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.。

應用

1972年,Hal Varian提出這個定律來用作檢查支持某些公共計劃的經濟數據有否欺瞞之處。1992年,Mark J. Nigrini便在其博士論文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它檢查是否有偽帳。

推而廣之,它能用於在會計學、金融甚至選舉中出現的數據。

华盛顿邮报引用该定律声称2009年伊朗总统大选中有造假。[1]

若所用的數據有指定數值範圍;或不是以機率分布出現的數據,如常態分佈的數據;這個定律則不準確。

歷史

1881年,天文學家西蒙·紐康發現對數表包含以1起首的數那首幾頁較其他頁破爛。

1938年,物理學家弗兰克·本福特英语Frank Benford再次發現這個現象,還通過了檢查許多數據來證實這點。

2009年,西班牙数学家在素数中发现了一种新模式,并且惊讶于为何现在才为人发现。虽然素数一般被认为是随机分布的,但西班牙数学家发现素数数列中每个素数的首位数字有明显的分布规律,它可以被描述了素数的本福特定律。这项新发现除了提供对素数属性的新洞见之外,还能应用于欺骗检测和股票市场分析等领域。[2]

参见

参考文献

  1. ^ Bernd Beber; Alexandra Scacco. The Devil Is in the Digits: Evidence That Iran's Election Was Rigged. Washington Post. 2009-06-20 [2020-11-07]. (原始内容于2021-03-22) (英语). 
  2. ^ Bartolo Luque; Lucas Lacasa. The First-Digit Frequencies of Prime Numbers and Riemann Zeta Zeros. Proceedings: Mathematical, Physical and Engineering Sciences. 2009, 465 (2107): 2197–2216. JSTOR 30245457. doi:10.1098/rspa.2009.0126 (英语). 

參考

  • Alex Ely Kossovsky. Benford's Law: Theory, the General Law of Relative Quantities, and Forensic Fraud Detection Applications (页面存档备份,存于互联网档案馆, 2014, World Scientific Publishing. ISBN 978-981-4583-68-8.
  • Simon Newcomb. Note on the Frequency of Use of the Different Digits in Natural Numbers., American Journal of Mathematics, 4 (1881), p. 39 [1] (页面存档备份,存于互联网档案馆
  • 2005年6月2日明報D15版,《假帳剋星——本福特定律》,吳端偉博士
  • 以下為其參考:
  • Frank Benford: The law of anomalous numbers, Proceedings of the American Philosophical Society, 78 (1938), p. 551
  • Ted Hill: The first digit phenomenon, American Scientist 86 (July-August 1998), p. 358.
  • Hal Varian: Benford's law, American Statistician 26, p.65.
  • New Pattern Found in Prime Numbers physorg.com (页面存档备份,存于互联网档案馆

本福特定律, 在数学中, 英語, benford, 描述了真实数字数据集中首位数字的频率分布, 一堆從實際生活得出的數據中, 以1為首位數字的數的出現機率約為總數的三成, 接近直覺得出之期望值1, 9的3倍, 推廣來說, 越大的數, 以它為首幾位的數出現的機率就越低, 它可用於檢查各種數據是否有造假, 但要注意使用條件, 數據至少3000筆以上, 不能有人為操控, 來源請求, 目录, 數學, 不完整的解釋, 應用, 歷史, 参见, 参考文献, 參考數學, 编辑說明在b, displaystyle, 進位制中, 以數. 在数学中 本福特定律 英語 Benford s law 描述了真实数字数据集中首位数字的频率分布 一堆從實際生活得出的數據中 以1為首位數字的數的出現機率約為總數的三成 接近直覺得出之期望值1 9的3倍 推廣來說 越大的數 以它為首幾位的數出現的機率就越低 它可用於檢查各種數據是否有造假 但要注意使用條件 1 數據至少3000筆以上 2 不能有人為操控 來源請求 目录 1 數學 2 不完整的解釋 3 應用 4 歷史 5 参见 6 参考文献 7 參考數學 编辑本福特定律說明在b displaystyle b 進位制中 以數n displaystyle n 起頭的數出現的機率為 P n log b n 1 log b n log b n 1 n displaystyle P n log b n 1 log b n log b left frac n 1 n right 其中n 1 2 b 1 displaystyle n 1 2 b 1 班佛定律不但適用於個位數字 連多位的數也可用 在十進制首位數字的出現機率 小數點後一個位 n P n displaystyle P n P n displaystyle P n 的相對大小1 30 1 30 1 2 17 6 17 6 3 12 5 12 5 4 9 7 9 7 5 7 9 7 9 6 6 7 6 7 7 5 8 5 8 8 5 1 5 1 9 4 6 4 6 不完整的解釋 编辑一組平均增長的數據開始時 增長得較慢 由最初的數字a displaystyle a 增長到另一個數字a 1 displaystyle a 1 起首的數的時間 必然比a 1 displaystyle a 1 起首的數增長到a 2 displaystyle a 2 需要更多時間 所以出現率就更高了 從數數目來說 順序從1開始數 1 2 3 9 從這點終結的話 所有數起首的機會似乎相同 但9之後的兩位數10至19 以1起首的數又大大拋離了其他數了 而下一堆9起首的數出現之前 必然會經過一堆以2 3 4 8起首的數 若果這樣數法有個終結點 以1起首的數的出現率一般都比9大 另一种解释如下 当数据跨越多个数量级时 更自然的做法是画在对数坐标中 如果这些数据在对数坐标下的分布是均匀的 那么本福特定律自然成立 即使在对数坐标下的概率密度函数不是常数 只要其变化足够缓慢 且数据跨越了多个数量级 本福特定律也会近似成立 如下图所示 這個定律的嚴格證明 可以參見Hill T P A Statistical Derivation of the Significant Digit Law Stat Sci 10 354 363 1996 應用 编辑1972年 Hal Varian提出這個定律來用作檢查支持某些公共計劃的經濟數據有否欺瞞之處 1992年 Mark J Nigrini便在其博士論文 The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies Ph D thesis Cincinnati OH University of Cincinnati 1992 提出以它檢查是否有偽帳 推而廣之 它能用於在會計學 金融甚至選舉中出現的數據 华盛顿邮报引用该定律声称2009年伊朗总统大选中有造假 1 若所用的數據有指定數值範圍 或不是以機率分布出現的數據 如常態分佈的數據 這個定律則不準確 歷史 编辑1881年 天文學家西蒙 紐康發現對數表包含以1起首的數那首幾頁較其他頁破爛 1938年 物理學家弗兰克 本福特 英语 Frank Benford 再次發現這個現象 還通過了檢查許多數據來證實這點 2009年 西班牙数学家在素数中发现了一种新模式 并且惊讶于为何现在才为人发现 虽然素数一般被认为是随机分布的 但西班牙数学家发现素数数列中每个素数的首位数字有明显的分布规律 它可以被描述了素数的本福特定律 这项新发现除了提供对素数属性的新洞见之外 还能应用于欺骗检测和股票市场分析等领域 2 参见 编辑齊夫定律参考文献 编辑 Bernd Beber Alexandra Scacco The Devil Is in the Digits Evidence That Iran s Election Was Rigged Washington Post 2009 06 20 2020 11 07 原始内容存档于2021 03 22 英语 Bartolo Luque Lucas Lacasa The First Digit Frequencies of Prime Numbers and Riemann Zeta Zeros Proceedings Mathematical Physical and Engineering Sciences 2009 465 2107 2197 2216 JSTOR 30245457 doi 10 1098 rspa 2009 0126 英语 參考 编辑Alex Ely Kossovsky Benford s Law Theory the General Law of Relative Quantities and Forensic Fraud Detection Applications 页面存档备份 存于互联网档案馆 2014 World Scientific Publishing ISBN 978 981 4583 68 8 Simon Newcomb Note on the Frequency of Use of the Different Digits in Natural Numbers American Journal of Mathematics 4 1881 p 39 1 页面存档备份 存于互联网档案馆 2005年6月2日明報D15版 假帳剋星 本福特定律 吳端偉博士 2 以下為其參考 Frank Benford The law of anomalous numbers Proceedings of the American Philosophical Society 78 1938 p 551 Ted Hill The first digit phenomenon American Scientist 86 July August 1998 p 358 10頁的pdf文件 Hal Varian Benford s law American Statistician 26 p 65 New Pattern Found in Prime Numbers physorg com 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title 本福特定律 amp oldid 74635109, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。