fbpx
维基百科

德国坦克问题

统计学理论估计中,用不放回抽样来估计离散型均匀分布最大值问题中著名的德国坦克问题(英語:German tank problem),它因在第二次世界大战中用于估计德国坦克数量而得名。

第二次世界大战期间,盟军情报部门用统计学方法准确地估计了德国坦克的生产数量,如豹式坦克

这些分析说明了频率推断和贝叶斯推断之间的不同。

基于“单个”样本估计的样本总数各有不同,而在“多个”样本的基础上估计则是现实生活中一个很有意义的估计问题,它的答案很简单,但并不那么明显。

范例 编辑

假设某个情报人员已经发现了k = 4辆坦克,其序列号分别为2、6、7、14,观测到的最大的序列号为m = 14。坦克未知的总数设为N

按“频率论”方法的估算公式,计算出坦克总数为:

 

而“贝叶斯”分析会给出一个估计坦克数量的概率质量函数,如下所示:

 

从中,我们可以估计坦克数量:

 

这个分布的偏度为正,因为其中有一个事实,即至少有14辆坦克。

历史上的问题 编辑

 
豹式坦克被装载运输至前线,摄于1943年。

在战争的过程中,西方盟国一直在努力确定德国的生产速度,并以两种主要方式得到这个数据:常规情报收集和统计估计。大部分情况下,统计估计的可信度很大程度上决定于常规情报收集。而有时常规情报收集会和统计估计一起结合使用,如在D日前夕估计豹式坦克的生产速度。

盟军指挥机构已经注意到了出现在意大利的五号坦克(豹式坦克),速度快,装备有75 mm/L70长管戰車砲,是很不寻常的重型坦克,但在法国北部编号就很小,就和虎I坦克在突尼斯那样。由于谢尔曼坦克在对阵三号坦克四号坦克时表现良好,美国陆军对它非常自信,以至于迫不及待地希望与他们相遇[N 1]。就在D日的不久前,有消息称德国手中有大量的五号坦克。

为了确定这种说法的真实性,盟军要尝试估计正在生产坦克的数量。为此,他们要使用被缴获或被摧毁的坦克的序列号。他们主要使用变速箱的号码,因为其为两个完整的序列。底盘和发动机号码也有使用,但它们的编号规则比较复杂。各种其他的零件用来对分析结果进行交叉检查。对轮胎也做了类似的分析,其上观察到了顺序编号(即1、2、3、……、N)。[2][a][3][4]

对坦克车轮的分析产生了对使用中的车轮模具数量的估计。在与英国车轮制造商讨论过后,他们估计了这么多的模具可以生产多少车轮,进而是每个月可生产的坦克数量。对两辆坦克(每辆32个车轮,总计64个车轮)车轮的分析的结果是1944年2月的生产数量估计在270左右,大大超出此前预期。[5]

德国战后公布的记录显示,1944年2月一个月的生产量是276辆[6][N 2]。统计方法结果的精确度是常规情报收集方法所远远不能达到的,而“德国坦克问题”这个词也成为了这种统计分析问题的标志。

估计产量并不是这种序列号分析的唯一应用。它也用于探查更多德国生产的信息,包括工厂数目、工厂的相对重要性、供应链长度(基于生产和使用之间的滞后程度)、生产工艺的改变、及对诸如橡胶等资源的使用。

具体数据 编辑

根据常规盟军情报的估计,德国在1940年6月和1942年9月之间,每月大约能生产1,400辆坦克。将缴获坦克的序列号代入下文的公式,可计算出每月246辆。战后,从阿尔伯特·斯佩尔所管辖的部门缴获的德国生产记录显示,实际数目是245辆[3]

某些特定月份的估计如下:[7][8]

月份 统计估计 情报估计 德国记录
1940年6月 169 1,000 122
1941年6月 244 1,550 271
1942年8月 327 1,550 342

类似分析 编辑

 
统计方法精确地估计了V-2火箭的生产。

在二战期间,类似的序列号分析也在其他军事装备上应用过,其中最成功的属V-2火箭[9]

二战期间,德国情报部门分析了苏联军事装备工厂,朝鲜战争期间苏联装备工厂也被分析过。苏联在二战期间也估计过德国坦克的生产数。[10]

20世纪80年代,一些美国人被获准进入以色列的梅卡瓦坦克的生产线。生产编号是分类过的,但水箱上有序列号,可以用来估计生产量。[11]

该公式在非军事中也有使用,如估计Commodore 64计算机的总数,其结果(1.25亿)与官方数字相当匹配。[12]

应对措施 编辑

为了防止序列号分析,可以不使用序列号,或者减少可用的辅助信息。此外可以使用抗密码分析的序列号,最有效的方法是从比生产物品数量大得多的列表中随机选择一个号码,之后就不再使用(一次性密码本),或产生随机数后检查是否在已分配编号列表上;编号可能会发生碰撞,除非编号可能的位数数目在生产物品数字位数的两倍以上(其中序列号可以以任何数为底);参见生日问题[b]。对此可使用密码学安全伪随机数生成器。要想从序列号中反推生产订单,对所有这些方法都需要一个查找表(或破解加密器),其使序列号变得复杂:如对于加密器,不能一次反推一串序列号,每个号码都必须单独查找,或者是一张生成列表。

另外,还可以对连续的序列号进行加密,同时方便解码,但这会带来潜在的已知明文攻击:即使从任意数开始,明文都会具有特定模式(即数字是有序的)。一个例子是在肯·福勒特的小说《代码为零》中,木星-C火箭的序列号加密规则为:

H U N T S V I L E X
1 2 3 4 5 6 7 8 9 0

此处的代码字为Huntsville(省略重复字母),用以获得一张10字的键值表。因此,13号火箭编为“HN”,而24号火箭则是“UT”。

频率论分析 编辑

最小方差无偏估计 编辑

对于点估计(估算出单个总体( )值),最小方差无偏估计(MVUE,或UMVU估计)由下式给出:[c]

 

其中m是所观察到的最大序号(样本最大值),而k是观察到的坦克数目(样本容量)[11][13][14]。注意,一旦观察到一个序列号,它就不再在样本池中,也不会被再次观察到。

其方差为[11]

 

因而标准差约为N/k,即样本间距的(总体)平均大小;注意与前文中的m/k相比。

直观 编辑

公式可以直观地理解为样本最大值加上样本中观测值之间的平均间距,由于是最大似然估计,样本最大值被用作初始估计值[d],再加上间距以补偿样本最大值的负偏差,以此作为总体最大值的一个估计[e],因而可写成:

 

可以想象样品在整个区间内均匀分布,而更多的样本就在0至N + 1的区间之外。 如果在0和编号最小样本(样本最小值)之间选一个初始间距,那么样本间的平均间距是 ;有 是因为样本本身在计算样本间距时不应算入。[f]

这一理念确立并推广了最大间距估计的方法。

推导 编辑

样本最大值等于m的概率为 ,其中 二项式系数

样本最大值的期望值为

 

因而

 

N无偏估计

为了表明这是UMVU估计:

  • 首先表明样本最大值是总体最大值的充分统计,使用类似于在充分性:均匀分布中具体阐述的方法(但对于德国坦克问题,我们必须排除在样本中出现两次序列号的结果);
  • 接着表明这是一个完整统计。
  • 那么根据莱曼–薛费定理,如上纠正过偏差的样本最大值是无偏的,也就是UMVU估计。

置信区间 编辑

此外,或者补充来说,对于“点”估计可以进行“区间”估计,如置信区间。基于k个样本落在覆盖全范围p(0 ≤ p ≤ 1)的区间的概率为pk,可以很容易地计算出这些结果(在此段中假设取样后“放回”以简化计算,如果取样后不放回则会夸大概率,区间也将过于保守)。

因此,样本最大值的分位数的抽样分布曲线是x1/k在0到1上的图像:样本最大值m的第p到第q个分位数是区间[p1/kN, q1/kN]。反转这个结果就产生总体最大值的相应置信区间[m/q1/k, m/p1/k]。下界非常接近m,所以取p = 5%到100%得到的非对称置信区间更有意义;k = 5时会产生 ,所以区间为[m, 1.82m]。

例如,对k = 5,取对称的95%区间,即令p = 2.5%,q = 97.5%,可得   ,所以置信区间大约为 

更一般地,(下偏)95%置信区间为 。对于一系列的k,附上UMVU的点估计值(加1以便于阅读)以便参考,可得:

k 点估计值 置信区间
1    
2    
5    
10    
20    

从中可发现:

  • 对于较小的样本容量,置信区间很宽,反映了其估计值具有很大的不确定性。
  • 范围迅速缩小,反映了“所有”样品远低于最大值的概率呈指数衰减。
  • 置信区间呈正偏态,因为N永远不可能低于样本最大值,但却可能比它任意大。

注意,m/k不能天真地用作(或者更确切地说,是(m + m/k − 1)/k标准差SE的估计值,因为标准差的估计值基于“总体”最大值(一个参数),在这里用估计值来估计误差会造成循环论证

在某些领域,尤其是在未来学中,以这种方式基于单个样本估计置信区间——考虑到它是一个随机取样的分位数(根据平庸原理)——称为哥白尼原则。这一点特别适用于基于目前的年龄来估计寿命,尤其是末日论将其用于估计人类的预期存活时间。

贝叶斯分析 编辑

在德国坦克问题中,贝叶斯方法要考虑当观察到的坦克总数 等于数 、序列号最大值 等于数 时敌方坦克总数 等于数 的可信度 

为了简便起见,以下将 写成 

条件概率的法则会给出

 

表达式 是当敌方坦克总数等于已知的 、且观察到了 辆敌方坦克时,所观察到的序列号最大值等于 的条件概率。其为

 

其中二项式系数 是从总数为 的总体中取 个样本的方法数。

表达式 是在真正观测前,假设观察了k辆坦克后,最大序号等于m的概率。通过合并所有可能的  可以改写为其它形式。

 

表达式 为当已观察到k辆坦克、但序列号尚未统计前坦克总数等于n的可信度。假定它是某种离散均匀分布

 

上限 必须是有限的,因为该函数

 

的结果为: ,而这不是一个概率质量函数。

因而

 

如果 ,那么不受欢迎的变量 就能从表达式中消失。

 

k ≥ 1时,敌方坦克数量分布的众数m

k ≥ 2时,敌方坦克数量“等于” 的可信度为

 

而敌方坦克数量 “大于” 的可信度为

 

k ≥ 3时, 均值有限:

 

k ≥ 4时, 标准差有限:

 

这些公式将在下面推导。

求和公式 编辑

下面的等式用二项式系数表示法来简化德国坦克问题中的级数

 

这个求和公式有点类似于积分公式

 

这些公式在k > 1时适用。

一辆坦克 编辑

n辆坦克的总体中随机观察一辆坦克,当mn时,其序列号为m的概率为1/n,而当m > n时概率是零。用艾弗森括号表示法可写成

 

这是 的条件概率质量分布函数。

m为定值时,这是一个n似然函数

 

最大似然估计的坦克总数为N0 = m

总概率为无穷大,因为尾部为一个调和级数数列。

 

 

其中 调和数

可信度质量分布函数依赖于先前的限制 

 

 的均值为

 

两辆坦克 编辑

如果观察到了两辆坦克,而不是一辆,那么所观察到的两个序列号中较大值为m的概率为

 

m为定值时,这是一个n似然函数

 

总概率为

 

可信度质量分布函数为

 

中位数 满足

 

所以

 

因而中位数为

 

N的均值为无穷大

 

多辆坦克 编辑

可信度质量分布函数 编辑

在序列号{1,...,n}中观测到的最大值为k的条件概率m

 

n的似然函数表达式与此相同

 

k ≥ 2的总概率为一个有限值:

 

可信度质量分布函数为

 

互补累积分布函数N > x的可信度

 

累积分布函数Nx的可信度

 

数量级 编辑

敌方坦克数目的数量级为

 

统计不确定度 编辑

统计的不确定度用标准差σ表示,其满足等式

 

所以

 

 

方差均值比则为

 

参见 编辑

  • 标记重捕法,另一种估计样本总数的方法
  • 最大间距估计,对“假设均匀分布”直觉的推广
  • 哥白尼原则,类似的预测,基于单个样本(目前的年龄)计算预期寿命。
    • 一个应用:末日论,估计人类的预期生存时间

其他对估计的讨论 编辑

参考 编辑

注释
  1. ^ 一份1943年11月的装甲地面部队政策条款中这么说:“不同意让有限数量的坦克携带90毫米戰車砲(M3戰車砲),原因如下:M4坦克被广泛誉为当今战场上最好的坦克……在面对德国六号坦克(虎式坦克)时没有必要担心我们的部队。T26坦克可能就没有这个基础,除了坦克与坦克对决——而这既不合理,也没必要。”[1]
  2. ^ 拉格尔斯与布罗迪的论文很大程度上是对实际问题分析和总结,而不是数学——估计问题只在第82页的脚注3中提到,其中他们估计最大值的方法是“样本最大值+平均间距”。
  1. ^ 编号的下界未知,但为了简化讨论通常省略这个细节,而设下界为已知的1。
  2. ^ 如在生日攻击中论述的那样,如果从H的可能输出中选择,在1.25√H次后预期就会发生一次碰撞。平方根对应一半的数字位数。例如,一个100位的数字平方根大致是一个50位的数,无论在何种进制当中。
  3. ^ 在连续分布中,没有−1这个术语。
  4. ^ 给定一组特定的观测结果,那么总体最大值最可能是样本最大值,而不是其它更大的值(不可能更小)。
  5. ^ 样本最大值不会超过总体最大值,但可以更小,因此它是一个有偏估计:它往往会“低估”总体最大值。
  6. ^ 例如,2和7的间距为(7 − 2) − 1 = 4,即3、4、5、6。
引用
  1. ^ AGF policy statement. Chief of staff AGF. November 1943. MHI
  2. ^ Ruggles & Brodie 1947,第?頁.
  3. ^ 3.0 3.1 Gavyn Davies does the maths - How a statistical formula won the war, 卫报, 20 July 2006 [6 July 2014], (原始内容于2013-07-26) 
  4. ^ Matthews, Robert, , 新科学人, 23 May 1998, (原始内容存档于2001年4月18日) 
  5. ^ Bob Carruthers. Panther V in Combat. Coda Books Ltd. : 94– [2014-07-07]. ISBN 978-1-908538-15-4. (原始内容于2014-07-18). 
  6. ^ Ruggles & Brodie 1947,第82–83頁.
  7. ^ Ruggles & Brodie 1947,第89頁.
  8. ^ Order Statistics. The University of Alabama in Huntsville. Virtual Laboratories in Probability and Statistics. [8 July 2014]. (原始内容于2014-07-14).  外部链接存在于|publisher= (帮助)
  9. ^ Ruggles & Brodie 1947,第90–91頁.
  10. ^ Volz 2008.
  11. ^ 11.0 11.1 11.2 Johnson 1994.
  12. ^ . pagetable.com. 1 February 2011 [6 July 2014]. (原始内容存档于2016-03-06). ,但不充分。
  13. ^ Johnson, Roger, Estimating the Size of a Population (PDF), , 2006, (原始内容存档于2008-11-20) 
  14. ^ Joyce, Smart. . 罗根高中. [8 July 2014]. (原始内容存档于2012-04-24). 
文献
  • Leo A. Goodman. Some Practical Techniques in Serial Number Analysis. Journal of the American Statistical Association. doi:10.2307/2281038. 
  • Roger W. Johnson. Estimating the Size of a Population. Teaching Statistics. 1994-06-01, 16 (2): 50–52 [2018-04-02]. ISSN 1467-9639. doi:10.1111/j.1467-9639.1994.tb00688.x (英语). 
  • Richard Ruggles, Henry Brodie. An Empirical Approach to Economic Intelligence in World War II. Journal of the American Statistical Association: 72–91. [2018-04-02]. doi:10.1080/01621459.1947.10501915. (原始内容于2018-11-06). 
  • Arthur G. Volz. A Soviet Estimate of German Tank Production1. The Journal of Slavic Military Studies: 588–590. doi:10.1080/13518040802313902. 

德国坦克问题, 在统计学理论的估计中, 用不放回抽样来估计离散型均匀分布最大值问题中著名的, 英語, german, tank, problem, 它因在第二次世界大战中用于估计德国坦克数量而得名, 第二次世界大战期间, 盟军情报部门用统计学方法准确地估计了德国坦克的生产数量, 如豹式坦克, 这些分析说明了频率推断和贝叶斯推断之间的不同, 基于, 单个, 样本估计的样本总数各有不同, 而在, 多个, 样本的基础上估计则是现实生活中一个很有意义的估计问题, 它的答案很简单, 但并不那么明显, 目录, 范例, 历史上的. 在统计学理论的估计中 用不放回抽样来估计离散型均匀分布最大值问题中著名的德国坦克问题 英語 German tank problem 它因在第二次世界大战中用于估计德国坦克数量而得名 第二次世界大战期间 盟军情报部门用统计学方法准确地估计了德国坦克的生产数量 如豹式坦克 这些分析说明了频率推断和贝叶斯推断之间的不同 基于 单个 样本估计的样本总数各有不同 而在 多个 样本的基础上估计则是现实生活中一个很有意义的估计问题 它的答案很简单 但并不那么明显 目录 1 范例 2 历史上的问题 2 1 具体数据 2 2 类似分析 2 3 应对措施 3 频率论分析 3 1 最小方差无偏估计 3 1 1 直观 3 1 2 推导 3 2 置信区间 4 贝叶斯分析 4 1 求和公式 4 2 一辆坦克 4 3 两辆坦克 4 4 多辆坦克 4 4 1 可信度质量分布函数 4 4 2 数量级 4 4 3 统计不确定度 5 参见 5 1 其他对估计的讨论 6 参考范例 编辑假设某个情报人员已经发现了k 4 辆坦克 其序列号分别为2 6 7 14 观测到的最大的序列号为m 14 坦克未知的总数设为N 按 频率论 方法的估算公式 计算出坦克总数为 N m m k 1 16 5 displaystyle N approx m frac m k 1 16 5 nbsp 而 贝叶斯 分析会给出一个估计坦克数量的概率质量函数 如下所示 Pr N n 0 if n lt m k 1 k m 1 k 1 n k if n m displaystyle Pr N n begin cases 0 amp text if n lt m frac k 1 k frac binom m 1 k 1 binom n k amp text if n geq m end cases nbsp 从中 我们可以估计坦克数量 N m s 19 5 10 m m 1 k 1 k 2 s k 1 m 1 m k 1 k 3 k 2 2 displaystyle begin aligned N amp approx mu pm sigma 19 5 pm 10 mu amp m 1 frac k 1 k 2 sigma amp sqrt frac k 1 m 1 m k 1 k 3 k 2 2 end aligned nbsp 这个分布的偏度为正 因为其中有一个事实 即至少有14辆坦克 历史上的问题 编辑 nbsp 豹式坦克被装载运输至前线 摄于1943年 在战争的过程中 西方盟国一直在努力确定德国的生产速度 并以两种主要方式得到这个数据 常规情报收集和统计估计 大部分情况下 统计估计的可信度很大程度上决定于常规情报收集 而有时常规情报收集会和统计估计一起结合使用 如在D日前夕估计豹式坦克的生产速度 盟军指挥机构已经注意到了出现在意大利的五号坦克 豹式坦克 速度快 装备有75 mm L70长管戰車砲 是很不寻常的重型坦克 但在法国北部编号就很小 就和虎I坦克在突尼斯那样 由于谢尔曼坦克在对阵三号坦克和四号坦克时表现良好 美国陆军对它非常自信 以至于迫不及待地希望与他们相遇 N 1 就在D日的不久前 有消息称德国手中有大量的五号坦克 为了确定这种说法的真实性 盟军要尝试估计正在生产坦克的数量 为此 他们要使用被缴获或被摧毁的坦克的序列号 他们主要使用变速箱的号码 因为其为两个完整的序列 底盘和发动机号码也有使用 但它们的编号规则比较复杂 各种其他的零件用来对分析结果进行交叉检查 对轮胎也做了类似的分析 其上观察到了顺序编号 即1 2 3 N 2 a 3 4 对坦克车轮的分析产生了对使用中的车轮模具数量的估计 在与英国车轮制造商讨论过后 他们估计了这么多的模具可以生产多少车轮 进而是每个月可生产的坦克数量 对两辆坦克 每辆32个车轮 总计64个车轮 车轮的分析的结果是1944年2月的生产数量估计在270左右 大大超出此前预期 5 德国战后公布的记录显示 1944年2月一个月的生产量是276辆 6 N 2 统计方法结果的精确度是常规情报收集方法所远远不能达到的 而 德国坦克问题 这个词也成为了这种统计分析问题的标志 估计产量并不是这种序列号分析的唯一应用 它也用于探查更多德国生产的信息 包括工厂数目 工厂的相对重要性 供应链长度 基于生产和使用之间的滞后程度 生产工艺的改变 及对诸如橡胶等资源的使用 具体数据 编辑 根据常规盟军情报的估计 德国在1940年6月和1942年9月之间 每月大约能生产1 400辆坦克 将缴获坦克的序列号代入下文的公式 可计算出每月246辆 战后 从阿尔伯特 斯佩尔所管辖的部门缴获的德国生产记录显示 实际数目是245辆 3 某些特定月份的估计如下 7 8 月份 统计估计 情报估计 德国记录1940年6月 169 1 000 1221941年6月 244 1 550 2711942年8月 327 1 550 342类似分析 编辑 nbsp 统计方法精确地估计了V 2火箭的生产 在二战期间 类似的序列号分析也在其他军事装备上应用过 其中最成功的属V 2火箭 9 二战期间 德国情报部门分析了苏联军事装备工厂 朝鲜战争期间苏联装备工厂也被分析过 苏联在二战期间也估计过德国坦克的生产数 10 20世纪80年代 一些美国人被获准进入以色列的梅卡瓦坦克的生产线 生产编号是分类过的 但水箱上有序列号 可以用来估计生产量 11 该公式在非军事中也有使用 如估计Commodore 64计算机的总数 其结果 1 25亿 与官方数字相当匹配 12 应对措施 编辑 此章節沒有提供參考來源 內容可能無法查證 2013年1月 为了防止序列号分析 可以不使用序列号 或者减少可用的辅助信息 此外可以使用抗密码分析的序列号 最有效的方法是从比生产物品数量大得多的列表中随机选择一个号码 之后就不再使用 一次性密码本 或产生随机数后检查是否在已分配编号列表上 编号可能会发生碰撞 除非编号可能的位数数目在生产物品数字位数的两倍以上 其中序列号可以以任何数为底 参见生日问题 b 对此可使用密码学安全伪随机数生成器 要想从序列号中反推生产订单 对所有这些方法都需要一个查找表 或破解加密器 其使序列号变得复杂 如对于加密器 不能一次反推一串序列号 每个号码都必须单独查找 或者是一张生成列表 另外 还可以对连续的序列号进行加密 同时方便解码 但这会带来潜在的已知明文攻击 即使从任意数开始 明文都会具有特定模式 即数字是有序的 一个例子是在肯 福勒特的小说 代码为零 中 木星 C火箭的序列号加密规则为 H U N T S V I L E X1 2 3 4 5 6 7 8 9 0 此处的代码字为Huntsville 省略重复字母 用以获得一张10字的键值表 因此 13号火箭编为 HN 而24号火箭则是 UT 频率论分析 编辑最小方差无偏估计 编辑 对于点估计 估算出单个总体 N displaystyle hat N nbsp 值 最小方差无偏估计 MVUE 或UMVU估计 由下式给出 c N m 1 k 1 1 displaystyle hat N m left 1 k 1 right 1 nbsp 其中m是所观察到的最大序号 样本最大值 而k是观察到的坦克数目 样本容量 11 13 14 注意 一旦观察到一个序列号 它就不再在样本池中 也不会被再次观察到 其方差为 11 var N 1 k N k N 1 k 2 N 2 k 2 for small samples k N displaystyle operatorname var hat N frac 1 k frac N k N 1 k 2 approx frac N 2 k 2 text for small samples k ll N nbsp 因而标准差约为N k 即样本间距的 总体 平均大小 注意与前文中的m k相比 直观 编辑 公式可以直观地理解为样本最大值加上样本中观测值之间的平均间距 由于是最大似然估计 样本最大值被用作初始估计值 d 再加上间距以补偿样本最大值的负偏差 以此作为总体最大值的一个估计 e 因而可写成 N m m k k m m k 1 1 m 1 k 1 1 displaystyle hat N m frac m k k m mk 1 1 m left 1 k 1 right 1 nbsp 可以想象样品在整个区间内均匀分布 而更多的样本就在0至N 1的区间之外 如果在0和编号最小样本 样本最小值 之间选一个初始间距 那么样本间的平均间距是 m k k displaystyle m k k nbsp 有 k displaystyle k nbsp 是因为样本本身在计算样本间距时不应算入 f 这一理念确立并推广了最大间距估计的方法 推导 编辑 样本最大值等于m的概率为 m 1 k 1 N k displaystyle tbinom m 1 k 1 big tbinom N k nbsp 其中 displaystyle tbinom cdot cdot nbsp 是二项式系数 样本最大值的期望值为 m m k N m m 1 k 1 N k k N 1 k 1 N m 1 k 1 1 displaystyle begin aligned mu amp sum m k N m frac tbinom m 1 k 1 tbinom N k frac k N 1 k 1 Rightarrow N amp mu left 1 k 1 right 1 end aligned nbsp 因而 m 1 k 1 1 E m 1 k 1 1 N m 1 k 1 1 displaystyle begin aligned mu left 1 k 1 right 1 amp E left m left 1 k 1 right 1 right Rightarrow hat N amp m left 1 k 1 right 1 end aligned nbsp 为N的无偏估计 为了表明这是UMVU估计 首先表明样本最大值是总体最大值的充分统计 使用类似于在充分性 均匀分布中具体阐述的方法 但对于德国坦克问题 我们必须排除在样本中出现两次序列号的结果 接着表明这是一个完整统计 那么根据莱曼 薛费定理 如上纠正过偏差的样本最大值是无偏的 也就是UMVU估计 置信区间 编辑 此外 或者补充来说 对于 点 估计可以进行 区间 估计 如置信区间 基于k个样本落在覆盖全范围p 0 p 1 的区间的概率为pk 可以很容易地计算出这些结果 在此段中假设取样后 放回 以简化计算 如果取样后不放回则会夸大概率 区间也将过于保守 因此 样本最大值的分位数的抽样分布曲线是x1 k在0到1上的图像 样本最大值m的第p到第q个分位数是区间 p1 kN q1 kN 反转这个结果就产生总体最大值的相应置信区间 m q1 k m p1 k 下界非常接近m 所以取p 5 到100 得到的非对称置信区间更有意义 k 5时会产生0 05 1 5 0 55 displaystyle scriptstyle 0 05 1 5 approx 0 55 nbsp 所以区间为 m 1 82m 例如 对k 5 取对称的95 区间 即令p 2 5 q 97 5 可得0 025 1 5 0 48 displaystyle scriptstyle 0 025 1 5 approx 0 48 nbsp 0 975 1 5 0 995 displaystyle scriptstyle 0 975 1 5 approx 0 995 nbsp 所以置信区间大约为 1 005 m 2 08 m displaystyle scriptstyle left 1 005m 2 08m right nbsp 更一般地 下偏 95 置信区间为 m m 0 05 1 k m m 20 1 k displaystyle scriptstyle left m m 0 05 1 k right left m m cdot 20 1 k right nbsp 对于一系列的k 附上UMVU的点估计值 加1以便于阅读 以便参考 可得 k 点估计值 置信区间1 2 m displaystyle scriptstyle 2m nbsp m 20 m displaystyle scriptstyle m 20m nbsp 2 1 5 m displaystyle scriptstyle 1 5m nbsp m 4 5 m displaystyle scriptstyle m 4 5m nbsp 5 1 2 m displaystyle scriptstyle 1 2m nbsp m 1 82 m displaystyle scriptstyle m 1 82m nbsp 10 1 1 m displaystyle scriptstyle 1 1m nbsp m 1 35 m displaystyle scriptstyle m 1 35m nbsp 20 1 05 m displaystyle scriptstyle 1 05m nbsp m 1 16 m displaystyle scriptstyle m 1 16m nbsp 从中可发现 对于较小的样本容量 置信区间很宽 反映了其估计值具有很大的不确定性 范围迅速缩小 反映了 所有 样品远低于最大值的概率呈指数衰减 置信区间呈正偏态 因为N永远不可能低于样本最大值 但却可能比它任意大 注意 m k不能天真地用作 或者更确切地说 是 m m k 1 k 标准差SE的估计值 因为标准差的估计值基于 总体 最大值 一个参数 在这里用估计值来估计误差会造成循环论证 在某些领域 尤其是在未来学中 以这种方式基于单个样本估计置信区间 考虑到它是一个随机取样的分位数 根据平庸原理 称为哥白尼原则 这一点特别适用于基于目前的年龄来估计寿命 尤其是末日论将其用于估计人类的预期存活时间 贝叶斯分析 编辑在德国坦克问题中 贝叶斯方法要考虑当观察到的坦克总数K displaystyle scriptstyle K nbsp 等于数k displaystyle scriptstyle k nbsp 序列号最大值M displaystyle scriptstyle M nbsp 等于数m displaystyle scriptstyle m nbsp 时敌方坦克总数N displaystyle scriptstyle N nbsp 等于数n displaystyle scriptstyle n nbsp 的可信度 N n M m K k displaystyle scriptstyle N n mid M m K k nbsp 为了简便起见 以下将 N n M m K k displaystyle scriptstyle N n mid M m K k nbsp 写成 n m k displaystyle scriptstyle n mid m k nbsp 条件概率的法则会给出 n m k m n k n k m k displaystyle n mid m k m mid n k frac n mid k m mid k nbsp 表达式 m n k M m N n K k displaystyle scriptstyle m mid n k M m mid N n K k nbsp 是当敌方坦克总数等于已知的n displaystyle scriptstyle n nbsp 且观察到了k displaystyle scriptstyle k nbsp 辆敌方坦克时 所观察到的序列号最大值等于m displaystyle scriptstyle m nbsp 的条件概率 其为 m n k m 1 k 1 n k if k m n 0 otherwise displaystyle m mid n k begin cases frac binom m 1 k 1 binom n k amp text if k leq m leq n 0 amp text otherwise end cases nbsp 其中二项式系数 n k displaystyle scriptstyle binom n k nbsp 是从总数为n displaystyle scriptstyle n nbsp 的总体中取k displaystyle scriptstyle k nbsp 个样本的方法数 表达式 m k M m K k displaystyle scriptstyle m mid k M m mid K k nbsp 是在真正观测前 假设观察了k辆坦克后 最大序号等于m的概率 通过合并所有可能的n displaystyle scriptstyle n nbsp m k displaystyle scriptstyle m mid k nbsp 可以改写为其它形式 m k m k 1 m k n 0 n m k m k n 0 m n k n k m k n 0 m n k n k displaystyle begin aligned m mid k amp m mid k cdot 1 amp m mid k sum n 0 infty n mid m k amp m mid k sum n 0 infty m mid n k frac n mid k m mid k amp sum n 0 infty m mid n k n mid k end aligned nbsp 表达式 n k N n K k displaystyle scriptstyle n mid k N n mid K k nbsp 为当已观察到k辆坦克 但序列号尚未统计前坦克总数等于n的可信度 假定它是某种离散均匀分布 n k 1 W k if k n lt W 0 otherwise displaystyle n mid k begin cases frac 1 Omega k amp text if k leq n lt Omega 0 amp text otherwise end cases nbsp 上限W displaystyle Omega nbsp 必须是有限的 因为该函数 f n lim W 1 W k if k n lt W 0 otherwise displaystyle f n lim Omega rightarrow infty begin cases frac 1 Omega k amp text if k leq n lt Omega 0 amp text otherwise end cases nbsp 的结果为 f n 0 displaystyle f n 0 nbsp 而这不是一个概率质量函数 因而 n m k m n k n m W 1 m n k if m n lt W 0 otherwise displaystyle n mid m k begin cases frac m n k sum n m Omega 1 m n k amp text if m leq n lt Omega 0 amp text otherwise end cases nbsp 如果 n m m n k lt displaystyle scriptstyle sum n m infty m n k lt infty nbsp 那么不受欢迎的变量W displaystyle scriptstyle Omega nbsp 就能从表达式中消失 n m k 0 if n lt m m n k n m m n k if n m displaystyle n mid m k begin cases 0 amp text if n lt m frac m n k sum n m infty m n k amp text if n geq m end cases nbsp 当k 1时 敌方坦克数量分布的众数为m 当k 2时 敌方坦克数量 等于 n displaystyle n nbsp 的可信度为 N n M m k K k 2 0 if n lt m k 1 k m 1 k 1 n k if n m displaystyle N n M m geq k K k geq 2 begin cases 0 amp text if n lt m frac k 1 k frac binom m 1 k 1 binom n k amp text if n geq m end cases nbsp 而敌方坦克数量N displaystyle scriptstyle N nbsp 大于 n displaystyle scriptstyle n nbsp 的可信度为 N gt n M m k K k 2 1 if n lt m m 1 k 1 n k 1 if n m displaystyle N gt n M m geq k K k geq 2 begin cases 1 amp text if n lt m frac binom m 1 k 1 binom n k 1 amp text if n geq m end cases nbsp 当k 3时 N displaystyle N nbsp 的均值有限 m 1 k 1 k 2 displaystyle frac m 1 k 1 k 2 nbsp 当k 4时 N displaystyle scriptstyle N nbsp 的标准差有限 m 1 k 1 m 1 k k 2 2 k 3 displaystyle sqrt frac m 1 k 1 m 1 k k 2 2 k 3 nbsp 这些公式将在下面推导 求和公式 编辑 下面的等式用二项式系数表示法来简化德国坦克问题中的级数 n m 1 n k k k 1 1 m 1 k 1 displaystyle sum n m infty frac 1 binom n k frac k k 1 frac 1 binom m 1 k 1 nbsp 这个求和公式有点类似于积分公式 n m d n n k 1 k 1 1 m k 1 displaystyle int n m infty frac dn n k frac 1 k 1 frac 1 m k 1 nbsp 这些公式在k gt 1时适用 一辆坦克 编辑 从n辆坦克的总体中随机观察一辆坦克 当m n时 其序列号为m的概率为1 n 而当m gt n时概率是零 用艾弗森括号表示法可写成 M m N n K 1 m n m n n displaystyle M m N n K 1 m n frac m leq n n nbsp 这是m displaystyle scriptstyle m nbsp 的条件概率质量分布函数 当m为定值时 这是一个n的似然函数 L n n m n displaystyle mathcal L n frac n geq m n nbsp 最大似然估计的坦克总数为N0 m 总概率为无穷大 因为尾部为一个调和级数数列 n L n n m 1 n displaystyle sum n mathcal L n sum n m infty frac 1 n infty nbsp 但 n L n n lt W n m W 1 1 n H W 1 H m 1 displaystyle begin aligned sum n mathcal L n n lt Omega amp sum n m Omega 1 frac 1 n amp H Omega 1 H m 1 end aligned nbsp 其中H n displaystyle H n nbsp 为调和数 可信度质量分布函数依赖于先前的限制W displaystyle scriptstyle Omega nbsp N n M m K 1 n m m n n n lt W H W 1 H m 1 displaystyle begin aligned amp N n mid M m K 1 amp n m frac m leq n n frac n lt Omega H Omega 1 H m 1 end aligned nbsp N displaystyle scriptstyle N nbsp 的均值为 n n n m n m W 1 1 H W 1 H m 1 W m H W 1 H m 1 W m log W 1 m 1 displaystyle begin aligned sum n n cdot n m amp sum n m Omega 1 frac 1 H Omega 1 H m 1 amp frac Omega m H Omega 1 H m 1 amp approx frac Omega m log left frac Omega 1 m 1 right end aligned nbsp 两辆坦克 编辑 如果观察到了两辆坦克 而不是一辆 那么所观察到的两个序列号中较大值为m的概率为 M m N n K 2 m n m n m 1 n 2 displaystyle M m mid N n K 2 m n m leq n frac m 1 binom n 2 nbsp 当m为定值时 这是一个n的似然函数 L n n m m 1 n 2 displaystyle mathcal L n n geq m frac m 1 binom n 2 nbsp 总概率为 n L n m 1 1 n m 1 n 2 m 1 1 2 2 1 1 m 1 2 1 2 displaystyle begin aligned sum n mathcal L n amp frac m 1 1 sum n m infty frac 1 binom n 2 amp frac m 1 1 cdot frac 2 2 1 cdot frac 1 binom m 1 2 1 amp 2 end aligned nbsp 可信度质量分布函数为 N n M m K 2 n m L n n L n n m m 1 n n 1 displaystyle begin aligned amp N n mid M m K 2 amp n mid m amp frac mathcal L n sum n mathcal L n amp n geq m frac m 1 n n 1 end aligned nbsp 中位数N displaystyle scriptstyle tilde N nbsp 满足 n n N n m 1 2 displaystyle sum n n geq tilde N n m frac 1 2 nbsp 所以 m 1 N 1 1 2 displaystyle frac m 1 tilde N 1 frac 1 2 nbsp 因而中位数为 N 2 m 1 displaystyle tilde N 2m 1 nbsp 但N的均值为无穷大 m n n n m m 1 1 n m 1 n 1 displaystyle mu sum n n cdot n m frac m 1 1 sum n m infty frac 1 n 1 infty nbsp 多辆坦克 编辑 可信度质量分布函数 编辑 在序列号 1 n 中观测到的最大值为k的条件概率m为 M m N n K k 2 m n k m n m 1 k 1 n k displaystyle begin aligned amp M m N n K k geq 2 amp m mid n k amp m leq n frac binom m 1 k 1 binom n k end aligned nbsp n的似然函数表达式与此相同 L n n m m 1 k 1 n k displaystyle mathcal L n n geq m frac binom m 1 k 1 binom n k nbsp k 2的总概率为一个有限值 n L n m 1 k 1 1 n m 1 n k m 1 k 1 1 k k 1 1 m 1 k 1 k k 1 displaystyle begin aligned sum n mathcal L n amp frac binom m 1 k 1 1 sum n m infty 1 over binom n k amp frac binom m 1 k 1 1 cdot frac k k 1 cdot frac 1 binom m 1 k 1 amp frac k k 1 end aligned nbsp 可信度质量分布函数为 N n M m K k 2 n m k L n n L n n m k 1 k m 1 k 1 n k n m m 1 n m 2 k 2 n 1 k 1 n m m 1 n m 2 n 1 k 1 k 2 m 3 k 3 n 2 k 2 displaystyle begin aligned amp N n M m K k geq 2 n m k amp frac mathcal L n sum n mathcal L n amp n geq m frac k 1 k frac binom m 1 k 1 binom n k amp n geq m frac m 1 n frac binom m 2 k 2 binom n 1 k 1 amp n geq m frac m 1 n frac m 2 n 1 frac k 1 k 2 frac binom m 3 k 3 binom n 2 k 2 end aligned nbsp 互补累积分布函数是N gt x的可信度 N gt x M m K k 1 if x lt m n x 1 n m k if x m x lt m x m n x 1 k 1 k m 1 k 1 N k x lt m x m k 1 k m 1 k 1 1 n x 1 1 n k x lt m x m k 1 k m 1 k 1 1 k k 1 1 x k 1 x lt m x m m 1 k 1 x k 1 displaystyle begin aligned amp N gt x mid M m K k amp begin cases 1 amp text if x lt m sum n x 1 infty n m k amp text if x geq m end cases amp x lt m x geq m sum n x 1 infty frac k 1 k frac binom m 1 k 1 binom N k amp x lt m x geq m frac k 1 k frac binom m 1 k 1 1 sum n x 1 infty frac 1 binom n k amp x lt m x geq m frac k 1 k frac binom m 1 k 1 1 cdot frac k k 1 frac 1 binom x k 1 amp x lt m x geq m frac binom m 1 k 1 binom x k 1 end aligned nbsp 累积分布函数是N x的可信度 N x M m K k 1 N gt x M m K k x m 1 m 1 k 1 x k 1 displaystyle begin aligned amp N leq x M m K k amp 1 N gt x mid M m K k amp x geq m left 1 frac binom m 1 k 1 binom x k 1 right end aligned nbsp 数量级 编辑 敌方坦克数目的数量级为 m n n N n M m K k n n n m m 1 n m 2 k 2 n 1 k 1 m 1 1 m 2 k 2 1 n m 1 n 1 k 1 m 1 1 m 2 k 2 1 k 1 k 2 1 m 2 k 2 m 1 1 k 1 k 2 displaystyle begin aligned mu amp sum n n cdot N n M m K k amp sum n n n geq m frac m 1 n frac binom m 2 k 2 binom n 1 k 1 amp frac m 1 1 frac binom m 2 k 2 1 sum n m infty frac 1 binom n 1 k 1 amp frac m 1 1 frac binom m 2 k 2 1 cdot frac k 1 k 2 frac 1 binom m 2 k 2 amp frac m 1 1 frac k 1 k 2 end aligned nbsp 统计不确定度 编辑 统计的不确定度用标准差s表示 其满足等式 s 2 m 2 n n 2 N n M m K k displaystyle sigma 2 mu 2 sum n n 2 cdot N n mid M m K k nbsp 所以 s 2 m 2 m n n n 1 N n M m K k n m n n 1 m 1 n m 2 n 1 k 1 k 2 m 3 k 3 n 2 k 2 m 1 1 m 2 1 k 1 k 2 m 3 k 3 1 n m 1 n 2 k 2 m 1 1 m 2 1 k 1 k 2 m 3 k 3 1 k 2 k 3 1 m 3 k 3 m 1 1 m 2 1 k 1 k 3 displaystyle begin aligned sigma 2 mu 2 mu amp sum n n n 1 cdot N n mid M m K k amp sum n m infty n n 1 frac m 1 n frac m 2 n 1 frac k 1 k 2 frac binom m 3 k 3 binom n 2 k 2 amp frac m 1 1 frac m 2 1 frac k 1 k 2 cdot frac binom m 3 k 3 1 sum n m infty frac 1 binom n 2 k 2 amp frac m 1 1 frac m 2 1 frac k 1 k 2 frac binom m 3 k 3 1 frac k 2 k 3 frac 1 binom m 3 k 3 amp frac m 1 1 frac m 2 1 frac k 1 k 3 amp end aligned nbsp 及 s m 1 1 m 2 1 k 1 k 3 m m 2 k 1 m 1 m k 1 k 3 k 2 2 displaystyle begin aligned sigma amp sqrt frac m 1 1 frac m 2 1 frac k 1 k 3 mu mu 2 amp sqrt frac k 1 m 1 m k 1 k 3 k 2 2 amp end aligned nbsp 方差均值比则为 s 2 m m k 1 k 3 k 2 displaystyle frac sigma 2 mu frac m k 1 k 3 k 2 nbsp 参见 编辑标记重捕法 另一种估计样本总数的方法 最大间距估计 对 假设均匀分布 直觉的推广 哥白尼原则 类似的预测 基于单个样本 目前的年龄 计算预期寿命 一个应用 末日论 估计人类的预期生存时间其他对估计的讨论 编辑 最大似然估计 估计偏差 离散均匀分布的最大值 似然函数 例2参考 编辑注释 一份1943年11月的装甲地面部队政策条款中这么说 不同意让有限数量的坦克携带90毫米戰車砲 M3戰車砲 原因如下 M4坦克被广泛誉为当今战场上最好的坦克 在面对德国六号坦克 虎式坦克 时没有必要担心我们的部队 T26坦克可能就没有这个基础 除了坦克与坦克对决 而这既不合理 也没必要 1 拉格尔斯与布罗迪的论文很大程度上是对实际问题分析和总结 而不是数学 估计问题只在第82页的脚注3中提到 其中他们估计最大值的方法是 样本最大值 平均间距 编号的下界未知 但为了简化讨论通常省略这个细节 而设下界为已知的1 如在生日攻击中论述的那样 如果从H的可能输出中选择 在1 25 H次后预期就会发生一次碰撞 平方根对应一半的数字位数 例如 一个100位的数字平方根大致是一个50位的数 无论在何种进制当中 在连续分布中 没有 1这个术语 给定一组特定的观测结果 那么总体最大值最可能是样本最大值 而不是其它更大的值 不可能更小 样本最大值不会超过总体最大值 但可以更小 因此它是一个有偏估计 它往往会 低估 总体最大值 例如 2和7的间距为 7 2 1 4 即3 4 5 6 引用 AGF policy statement Chief of staff AGF November 1943 MHI Ruggles amp Brodie 1947 第 頁 sfn error no target CITEREFRugglesBrodie1947 help 3 0 3 1 Gavyn Davies does the maths How a statistical formula won the war 卫报 20 July 2006 6 July 2014 原始内容存档于2013 07 26 Matthews Robert Data sleuths go to war sidebar in feature Hidden truths 新科学人 23 May 1998 原始内容存档于2001年4月18日 Bob Carruthers Panther V in Combat Coda Books Ltd 94 2014 07 07 ISBN 978 1 908538 15 4 原始内容存档于2014 07 18 Ruggles amp Brodie 1947 第82 83頁 sfn error no target CITEREFRugglesBrodie1947 help Ruggles amp Brodie 1947 第89頁 sfn error no target CITEREFRugglesBrodie1947 help Order Statistics The University of Alabama in Huntsville Virtual Laboratories in Probability and Statistics 8 July 2014 原始内容存档于2014 07 14 外部链接存在于 publisher 帮助 Ruggles amp Brodie 1947 第90 91頁 sfn error no target CITEREFRugglesBrodie1947 help Volz 2008 sfn error no target CITEREFVolz2008 help 11 0 11 1 11 2 Johnson 1994 sfn error no target CITEREFJohnson1994 help How many Commodore 64 computers were really sold pagetable com 1 February 2011 6 July 2014 原始内容存档于2016 03 06 但不充分 Johnson Roger Estimating the Size of a Population PDF Getting the Best from Teaching Statistics 2006 原始内容存档于2008 11 20 Joyce Smart German Tank Problem 罗根高中 8 July 2014 原始内容存档于2012 04 24 文献Leo A Goodman Some Practical Techniques in Serial Number Analysis Journal of the American Statistical Association doi 10 2307 2281038 Roger W Johnson Estimating the Size of a Population Teaching Statistics 1994 06 01 16 2 50 52 2018 04 02 ISSN 1467 9639 doi 10 1111 j 1467 9639 1994 tb00688 x 英语 Richard Ruggles Henry Brodie An Empirical Approach to Economic Intelligence in World War II Journal of the American Statistical Association 72 91 2018 04 02 doi 10 1080 01621459 1947 10501915 原始内容存档于2018 11 06 Arthur G Volz A Soviet Estimate of German Tank Production1 The Journal of Slavic Military Studies 588 590 doi 10 1080 13518040802313902 取自 https zh wikipedia org w index php title 德国坦克问题 amp oldid 62295979, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。