

概率论中有若干关于随机变量收敛(Convergence of random variables)的定义。研究一随机变量是否会收敛到某个极限随机变量是概率论中的重要内容,在统计概率随机过程中都有应用。在更广泛的数学领域中,随机变量的收敛被称为随机收敛,表示一系列本质上随机不可预测的事件所发生的模式可以在样本数量足够大的时候得到合理可靠的预测。各种不同的收敛定义实际上是表示预测时不同的刻画方式。

简介 编辑

正如一个数列可能收敛到某个极限量,一列函数可能收敛到某个极限函数一样,随机收敛指的是一系列随机变量 n趋向于无穷大时,会越来越接近某个固定的极限。这个极限可能是指:

  1.  趋向某个固定的数;
  2.  趋向某个确定函数的输出值;
  3.  概率分布越来越接近某个特定的随机变量的概率分布;
  4.  和某个特定随机变量的差别的平均值(数学期望值)趋向于0;
  5.  和某个特定随机变量的差别的方差趋向于0。


依概率1收敛 编辑

依概率1收敛又称为几乎处处收敛,其定义接近于函数逐点收敛的定义。事实上,由于随机变量的本质是由样本空间 到取值空间 上的函数。因此,给定一个概率空间  中的一列 随机变量 ,考虑事件 。如果存在一个随机变量 ,使得事件 的概率为1,那么就称随机变量序列   依概率1收敛到  (或称   几乎处处收敛到  ),记作:


当取值空间 是一般的实数空间 时,依概率1收敛的意义是:


当空间 度量空间 (S, d) 的时候,依概率1收敛的意义是:


依概率收敛 编辑

  是一个随机变量序列, 是一个随机变量。如果对于任意的正实数 ,都有:


那么称序列  依概率收敛到 ,记作: 

如果 的取值空间是一个可分度量空间(Sd),那么依概率收敛的定义为[1]


依概率收敛和依概率1收敛的定义有相似之处,但本质上,依概率1收敛是比依概率收敛更“强”的收敛性质。如果一列随机变量依概率1收敛到某个极限,那么它必然也依概率收敛到这个极限,但反之则不然。一个实数上的例子是:设概率空间  区间 上的一个连续型均匀分布  。一个随机变量序列 定义为:








另一方面,考虑  这一组随机变量,它们取值为1的集合的并集恰好是总区间,因此对每一个 ,总会有  之间的某个变量 ,使得




即是说,  并不依概率1收敛到0。从例子中可以看到,依概率收敛比依概率1收敛更为宽松的地方是:当n趋于无穷大的时候,只要偏离极限函数的 (即是集合 中的 )“足够少”,就能使得依概率收敛成立了,这些 的集合可以随着n不同而不同;而依概率1收敛则要求 的集合固定地缩减至一个概率为0的集合。因此,依概率1收敛要比依概率收敛更为严格。

性质 编辑

  • 依概率收敛蕴含依分布收敛:一个依概率收敛的随机变量序列必然也依分布收敛到同一个极限。
  • 在离散概率空间中,依概率收敛和依概率1收敛是等价的。
  • 依分布收敛蕴含依概率收敛当且仅当依分布收敛的极限是一个常数。
  • 连续映射定理说明:对任意连续函数 ,如果随机变量序列 依概率收敛到 ,那么序列 依概率收敛到 
  • 依概率收敛定义了确定概率空间上的随机变量空间上的一个拓扑。这个拓扑可以用樊𰋀度量进行度量化[2]

平方平均收敛与收敛 编辑

另一种收敛的定义与测度的积分有关。在积分理论中,如果两个函数  满足 ,那么这两个函数在关于测度 的平方可积空间中相等。随机变量的平方平均收敛与此相似:如果对平方可积的随机变量序列 ,存在随机变量 ,使得 ,那么就说序列  平方平均收敛到 ,记作:


由于 空间是完备的,极限 也一定平方可积。

对于更一般的 空间,也有类似的定义:如果对  空间中的随机变量序列 ,存在 中的随机变量 ,使得 ,那么就说序列  收敛到 ,记作:


当常数 时,也称为平均收敛。

依分布收敛 编辑

依分布收敛是最宽松的收敛方式之一。这种收敛不要求查看每个 ,只要求序列的分布趋向于某个极限。直觉上,一个随机变量序列 依分布收敛到某个随机变量 ,如果:

对所有的 ,都有 

更严格的定义是探讨随机变量 累积分布函数 。设有实值的随机变量序列   和某个随机变量 (其累积分布函数为  ),如果对 的每个连续点 ,都有 ,那么就说  依分布收敛到某个随机变量 。记作:


由于依分布收敛只和随机变量的分布相关,所以也可以称一系列随机变量(依分布)收敛于某个分布。设 是极限 的分布,那么依分布收敛也可以记作:


例如一个随机变量序列 依分布收敛到标准正态分布,就可以记作:


性质 编辑

  • 作为最弱的收敛方式之一,依分布收敛无法推出其它的收敛方式。对于存在概率密度函數的连续型随机变量序列,依分布收敛并不能推出其概率密度函数也同样收敛。例如对于概率密度函數为 的随机变量序列,其依分布收敛到均匀分布的随机变量,但其概率密度函数不收敛[3]
  • 依分布收敛的等价定义:一个随机变量序列 依分布收敛到某个随机变量 和以下命题中的任意一个等价:
    • 对所有的有界连续函数 ,都有:  
    • 对所有具有利普希茨連續性质的函数 ,都有:  
    • 对所有上有界的上半连续函数 ,都有:  
    • 对所有下有界的下半连续函数 ,都有:  
    • 对所有闭集 ,都有:  
    • 对所有开集 ,都有:  
    • 对关于 的所有连续集 ,都有:  
  • 连续映射定理说明,对于连续函数g(·),如果随机变量序列  依分布收敛到随机变量 ,那么  也依分布收敛到随机变量 
  • 列维连续性定理: 随机变量序列 依分布收敛到某个随机变量  当且仅当对应的特征函数序列 逐点收敛到某个在0处连续的函数 (此时随机变量 的分布为 )。
  • 列维-普罗科洛夫度量是依分布收敛的度量化结果。

关系 编辑


  • 依概率1收敛可以推出依概率收敛[4]
  • 依概率收敛可以推出存在依概率1收敛的子列 [5]
  • 依概率收敛可以推出依分布收敛[4]
  • 对任意的  -收敛可以推出依概率收敛:
  • 如果 ,那么 -收敛可以推出 -收敛:
  • 如果序列 依分布收敛到常数c,那么它也依概率收敛到常数c[4]
  • 如果序列 依分布收敛到随机变量 ,并且  的差依概率收敛到0,那么  也依分布收敛到随机变量 [4]
  • 如果序列 依分布收敛到随机变量 ,并且 序列 依分布收敛到常数c,那么向量列 依分布收敛到随机变量 [4]

    参见 编辑

    参考书籍 编辑

其定义接近于函数逐点收敛的定义 事实上 由于随机变量的本质是由样本空间W displaystyle mathit Omega nbsp 到取值空间B displaystyle mathfrak B nbsp 上的函数 因此 给定一个概率空间 W F P displaystyle left mathit Omega mathcal F mathbb P right nbsp 中的一列 随机变量 X n n N displaystyle left X n n in mathbb N right nbsp 考虑事件A X w lim n X n w X w displaystyle A X left omega lim n to infty X n omega X omega right nbsp 如果存在一个随机变量X displaystyle X nbsp 使得事件A X displaystyle A X nbsp 的概率为1 那么就称随机变量序列 X n n N displaystyle left X n n in mathbb N right nbsp 依概率1收敛到 X displaystyle X nbsp 或称 X n n N displaystyle left X n n in mathbb N right nbsp 几乎处处收敛到 X displaystyle X nbsp 记作 X n a s X displaystyle X n xrightarrow a s X nbsp 或 P lim n X n X 1 displaystyle mathbb P left lim n to infty X n X right 1 nbsp 当取值空间B displaystyle mathfrak B nbsp 是一般的实数空间R displaystyle mathbb R nbsp 时 依概率1收敛的意义是 对任意的正实数e gt 0 displaystyle varepsilon gt 0 nbsp P lim inf w W X n w X w lt e 1 displaystyle mathbb P Big liminf big omega in Omega X n omega X omega lt varepsilon big Big 1 nbsp 当空间B displaystyle mathfrak B nbsp 是度量空间 S d 的时候 依概率1收敛的意义是 P w W d X n w X w n 0 1 displaystyle mathbb P Big omega in Omega d big X n omega X omega big xrightarrow n to infty 0 Big 1 nbsp 依概率收敛 编辑主条目 依概率收敛 设 X n n N displaystyle X n n in mathbb N nbsp 是一个随机变量序列 X displaystyle X nbsp 是一个随机变量 如果对于任意的正实数ϵ gt 0 displaystyle epsilon gt 0 nbsp 都有 lim n P X X n ϵ 0 displaystyle lim n to infty mathbb P X X n geq epsilon 0 nbsp 那么称序列 X n n N displaystyle X n n in mathbb N nbsp 依概率收敛到X displaystyle X nbsp 记作 X n n P X displaystyle X n xrightarrow n to infty mathbb P X nbsp 如果 X n n N displaystyle X n n in mathbb N nbsp 的取值空间是一个可分度量空间 S d 那么依概率收敛的定义为 1 P d X n X e 0 e gt 0 displaystyle mathbb P big d X n X geq varepsilon big to 0 quad forall varepsilon gt 0 nbsp 依概率收敛和依概率1收敛的定义有相似之处 但本质上 依概率1收敛是比依概率收敛更 强 的收敛性质 如果一列随机变量依概率1收敛到某个极限 那么它必然也依概率收敛到这个极限 但反之则不然 一个实数上的例子是 设概率空间 W F P displaystyle left mathit Omega mathcal F mathbb P right nbsp 是区间W 0 1 displaystyle mathit Omega 0 1 nbsp 上的一个连续型均匀分布P U displaystyle mathbb P mathbf U nbsp 一个随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 定义为 X 1 1 w 0 1 1 displaystyle X 1 mathbf 1 left omega in 0 1 right mathbf 1 nbsp X 2 1 w 0 1 2 X 3 1 w 1 2 1 displaystyle X 2 mathbf 1 left omega in 0 frac 1 2 right qquad X 3 mathbf 1 left omega in frac 1 2 1 right nbsp X 4 1 w 0 1 4 X 5 1 w 1 4 1 2 X 6 1 w 1 2 3 4 X 7 1 w 3 4 1 displaystyle X 4 mathbf 1 left omega in 0 frac 1 4 right qquad X 5 mathbf 1 left omega in frac 1 4 frac 1 2 right qquad X 6 mathbf 1 left omega in frac 1 2 frac 3 4 right qquad X 7 mathbf 1 left omega in frac 3 4 1 right nbsp displaystyle cdots nbsp k m N 0 k 2 m 1 X 2 m k 1 w k 2 m k 1 2 m displaystyle forall k m in mathbb N 0 leqslant k leqslant 2 m 1 X 2 m k mathbf 1 left omega in frac k 2 m frac k 1 2 m right nbsp 由于 2 m n 2 m 1 1 P X n 0 e 1 2 m displaystyle forall 2 m leqslant n leqslant 2 m 1 1 mathbb P left X n 0 geqslant varepsilon right frac 1 2 m nbsp 所以 X n P 0 displaystyle X n xrightarrow mathbb P 0 nbsp 另一方面 考虑X 2 m displaystyle X 2 m nbsp 到X 2 m 1 1 displaystyle X 2 m 1 1 nbsp 这一组随机变量 它们取值为1的集合的并集恰好是总区间 因此对每一个w 0 1 displaystyle omega in 0 1 nbsp 总会有X 2 m displaystyle X 2 m nbsp 到X 2 m 1 1 displaystyle X 2 m 1 1 nbsp 之间的某个变量X 2 m k m displaystyle X 2 m k m nbsp 使得 X 2 m k m w 1 displaystyle X 2 m k m omega 1 nbsp 所以 对任意一个w 0 1 displaystyle omega in 0 1 nbsp lim n X n w 0 0 displaystyle lim n to infty X n omega 0 neq 0 nbsp 即是说 X n n N displaystyle X n n in mathbb N nbsp 并不依概率1收敛到0 从例子中可以看到 依概率收敛比依概率1收敛更为宽松的地方是 当n趋于无穷大的时候 只要偏离极限函数的w displaystyle omega nbsp 即是集合 w n X n w n X w n e displaystyle left omega n X n omega n X omega n geqslant varepsilon right nbsp 中的w n displaystyle omega n nbsp 足够少 就能使得依概率收敛成立了 这些w n displaystyle omega n nbsp 的集合可以随着n不同而不同 而依概率1收敛则要求w n displaystyle omega n nbsp 的集合固定地缩减至一个概率为0的集合 因此 依概率1收敛要比依概率收敛更为严格 性质 编辑 依概率收敛蕴含依分布收敛 一个依概率收敛的随机变量序列必然也依分布收敛到同一个极限 在离散概率空间中 依概率收敛和依概率1收敛是等价的 依分布收敛蕴含依概率收敛当且仅当依分布收敛的极限是一个常数 连续映射定理说明 对任意连续函数g displaystyle g nbsp 如果随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依概率收敛到X displaystyle X nbsp 那么序列 g X n n N displaystyle g X n n in mathbb N nbsp 依概率收敛到g X displaystyle g X nbsp 依概率收敛定义了确定概率空间上的随机变量空间上的一个拓扑 这个拓扑可以用樊𰋀度量进行度量化 2 d X Y inf e gt 0 Pr X Y gt e e displaystyle d X Y inf big varepsilon gt 0 Pr big X Y gt varepsilon big leq varepsilon big nbsp 平方平均收敛与L p displaystyle mathbf L p 收敛 编辑另一种收敛的定义与测度的积分有关 在积分理论中 如果两个函数f displaystyle f nbsp 和g displaystyle g nbsp 满足 I f g 2 d m 0 displaystyle int mathcal I f g 2 d mu 0 nbsp 那么这两个函数在关于测度m displaystyle mu nbsp 的平方可积空间中相等 随机变量的平方平均收敛与此相似 如果对平方可积的随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 存在随机变量X displaystyle X nbsp 使得lim n E X n X 2 0 displaystyle lim n to infty mathbb E left X n X 2 right 0 nbsp 那么就说序列 X n n N displaystyle X n n in mathbb N nbsp 平方平均收敛到X displaystyle X nbsp 记作 X n L 2 X displaystyle X n xrightarrow mathbf L 2 X nbsp 由于L 2 displaystyle mathbf L 2 nbsp 空间是完备的 极限X displaystyle X nbsp 也一定平方可积 对于更一般的L p displaystyle mathbf L p nbsp 空间 也有类似的定义 如果对 L p displaystyle mathbf L p nbsp 空间中的随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 存在L p displaystyle mathbf L p nbsp 中的随机变量X displaystyle X nbsp 使得lim n E X n X p 0 displaystyle lim n to infty mathbb E left X n X p right 0 nbsp 那么就说序列 X n n N displaystyle X n n in mathbb N nbsp 依L p displaystyle mathbf L p nbsp 收敛到X displaystyle X nbsp 记作 X n L p X displaystyle X n xrightarrow mathbf L p X nbsp 当常数p 1 displaystyle p 1 nbsp 时 也称为平均收敛 依分布收敛 编辑依分布收敛是最宽松的收敛方式之一 这种收敛不要求查看每个w displaystyle omega nbsp 只要求序列的分布趋向于某个极限 直觉上 一个随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到某个随机变量X displaystyle X nbsp 如果 对所有的a displaystyle a nbsp 都有P X n a P X a displaystyle mathbb P X n leqslant a rightarrow mathbb P X leqslant a nbsp 更严格的定义是探讨随机变量X n displaystyle X n nbsp 的累积分布函数F n x P X n x displaystyle F n x mathbb P X n leqslant x nbsp 设有实值的随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 和某个随机变量X displaystyle X nbsp 其累积分布函数为 F x displaystyle F x nbsp 如果对F x displaystyle F x nbsp 的每个连续点x displaystyle x nbsp 都有lim n F n x F x displaystyle lim n to infty F n x F x nbsp 那么就说 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到某个随机变量X displaystyle X nbsp 记作 X n n D X displaystyle X n xrightarrow n to infty mathcal D X nbsp X n n d X displaystyle X n xrightarrow n to infty mathit d X nbsp 或 X n n L X displaystyle X n xrightarrow n to infty mathcal L X nbsp 由于依分布收敛只和随机变量的分布相关 所以也可以称一系列随机变量 依分布 收敛于某个分布 设L X displaystyle mathcal L X nbsp 是极限X displaystyle X nbsp 的分布 那么依分布收敛也可以记作 X n d L X X n X displaystyle X n xrightarrow d mathcal L X X n rightsquigarrow X nbsp 或 L X n L X displaystyle mathcal L X n to mathcal L X nbsp 例如一个随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到标准正态分布 就可以记作 X n d N 0 1 displaystyle X n xrightarrow d mathcal N 0 1 nbsp 性质 编辑 作为最弱的收敛方式之一 依分布收敛无法推出其它的收敛方式 对于存在概率密度函數的连续型随机变量序列 依分布收敛并不能推出其概率密度函数也同样收敛 例如对于概率密度函數为f n x 1 cos 2 p n x 1 x 0 1 displaystyle f n x left 1 cos 2 pi nx right mathbf 1 x in 0 1 nbsp 的随机变量序列 其依分布收敛到均匀分布的随机变量 但其概率密度函数不收敛 3 依分布收敛的等价定义 一个随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到某个随机变量X displaystyle X nbsp 和以下命题中的任意一个等价 对所有的有界连续函数f displaystyle f nbsp 都有 E f X n E f X displaystyle mathbb E f X n rightarrow mathbb E f X nbsp 对所有具有利普希茨連續性质的函数f displaystyle f nbsp 都有 E f X n E f X displaystyle mathbb E f X n rightarrow mathbb E f X nbsp 对所有上有界的上半连续函数f displaystyle f nbsp 都有 lim sup E f X n E f X displaystyle limsup mathbb E f X n leqslant mathbb E f X nbsp 对所有下有界的下半连续函数f displaystyle f nbsp 都有 lim inf E f X n E f X displaystyle liminf mathbb E f X n geqslant mathbb E f X nbsp 对所有闭集C displaystyle C nbsp 都有 lim sup n P X n C P X C displaystyle limsup n to infty mathbb P left X n in C right leqslant mathbb P left X in C right nbsp 对所有开集U displaystyle U nbsp 都有 lim inf n P X n U P X U displaystyle liminf n to infty mathbb P left X n in U right geqslant mathbb P left X in U right nbsp 对关于X displaystyle X nbsp 的所有连续集A displaystyle A nbsp 都有 lim n P X n A P X A displaystyle lim n to infty mathbb P left X n in A right mathbb P left X in A right nbsp 连续映射定理说明 对于连续函数g 如果随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到随机变量X displaystyle X nbsp 那么 g X n n N displaystyle g X n n in mathbb N nbsp 也依分布收敛到随机变量g X displaystyle g X nbsp 列维连续性定理 随机变量序列 X n n N displaystyle X n n in mathbb N nbsp 依分布收敛到某个随机变量X displaystyle X nbsp 当且仅当对应的特征函数序列 f n x n N displaystyle varphi n x n in mathbb N nbsp 逐点收敛到某个在0处连续的函数f displaystyle varphi nbsp 此时随机变量X displaystyle X nbsp 的分布为f displaystyle varphi nbsp 列维 普罗科洛夫度量是依分布收敛的度量化结果 关系 编辑各个收敛的定义有强弱之分 一个收敛性强于另一个是指从前者可以推出后者 例如依概率收敛强于依分布收敛 即是说如果一列随机变量依概率收敛到某个极限 那么必定也依分布收敛到这个极限 具体来说 收敛性的强弱关系可以用下图来表示 L r r gt s 1 L s a s p d displaystyle begin matrix xrightarrow L r amp underset r gt s geq 1 Rightarrow amp xrightarrow L s amp amp amp amp Downarrow amp amp xrightarrow a s amp Rightarrow amp xrightarrow p amp Rightarrow amp xrightarrow d end matrix nbsp 依概率1收敛可以推出依概率收敛 4 X n a s X X n p X displaystyle X n xrightarrow a s X quad Rightarrow quad X n xrightarrow p X nbsp 依概率收敛可以推出存在依概率1收敛的子列 k n displaystyle k n nbsp 5 X n p X X k n a s X displaystyle X n xrightarrow p X quad Rightarrow quad X k n xrightarrow a s X nbsp 依概率收敛可以推出依分布收敛 4 X n p X X n d X displaystyle X n xrightarrow p X quad Rightarrow quad X n xrightarrow d X nbsp 对任意的r gt 0 displaystyle r gt 0 nbsp L r displaystyle mathbf L r nbsp 收敛可以推出依概率收敛 X n L r X X n p X displaystyle X n xrightarrow L r X quad Rightarrow quad X n xrightarrow p X nbsp 如果r gt s 1 displaystyle r gt s geqslant 1 nbsp 那么L r displaystyle mathbf L r nbsp 收敛可以推出L s displaystyle mathbf L s nbsp 收敛 X n L r X X n L s X displaystyle X n xrightarrow L r X quad Rightarrow quad X n xrightarrow L s X nbsp 如果序列 X n n N displaystyle left X n n in mathbb N right nbsp 依分布收敛到常数c 那么它也依概率收敛到常数c 4 X n d c X n p c displaystyle X n xrightarrow d c quad Rightarrow quad X n xrightarrow p c nbsp 如果序列 X n n N displaystyle left X n n in mathbb N right nbsp 依分布收敛到随机变量X displaystyle X nbsp 并且X n displaystyle X n nbsp 和Y n displaystyle Y n nbsp 的差依概率收敛到0 那么Y n displaystyle Y n nbsp 也依分布收敛到随机变量X displaystyle X nbsp 4 X n d X X n Y n p 0 Y n d X displaystyle X n xrightarrow d X X n Y n xrightarrow p 0 quad Rightarrow quad Y n xrightarrow d X nbsp 如果序列 X n n N displaystyle left X n n in mathbb N right nbsp 依分布收敛到随机变量X displaystyle X nbsp 并且 序列 Y n n N displaystyle left Y n n in mathbb N right nbsp 依分布收敛到常数c 那么向量列 X n Y n n N displaystyle left X n Y n n in mathbb N right nbsp 依分布收敛到随机变量 X c displaystyle X c nbsp 4 X n d X Y n d c X n Y n d X c displaystyle X n xrightarrow d X Y n xrightarrow d c quad Rightarrow quad X n Y n xrightarrow d X c nbsp 参见 编辑 勒贝格控制收敛定理 单调收敛定理参考资料 编辑 Dudley 2002 Chapter 9 2 page 287 Dudley 2002 第289頁 Romano amp Siegel 1985 Example 5 26 4 0 4 1 4 2 4 3 4 4 van der Vaart 1998 Theorem 2 7 Gut Allan Probability A graduate course Theorem 3 4 Springer 2005 ISBN 0387228330 参考书籍 编辑 Bickel Peter J Klaassen Chris A J Ritov Ya acov Wellner Jon A Efficient and adaptive estimation for semiparametric models New York Springer Verlag 1998 ISBN 0387984739 引文使用过时参数coauthors 帮助 Billingsley Patrick Probability and Measure Wiley Series in Probability and Mathematical Statistics 2nd Wiley 1986 Billingsley Patrick Convergence of probability measures 2nd John Wiley amp Sons 1999 1 28 ISBN 0471197459 Dudley R M Real analysis and probability Cambridge UK Cambridge University Press 2002 ISBN 052180972X Grimmett G R Stirzaker D R Probability and random processes 2nd Clarendon Press Oxford 1992 271 285 ISBN 0 19 853665 8 引文使用过时参数coauthors 帮助 Jacobsen M Videregaende Sandsynlighedsregning Advanced Probability Theory 3rd HCO tryk Copenhagen 1992 18 20 ISBN 87 91180 71 6 Ledoux Michel Talagrand Michel Probability in Banach spaces Berlin Springer Verlag 1991 xii 480 ISBN 3 540 52013 9 MR 1102015 Romano Joseph P Siegel Andrew F Counterexamples in probability and statistics Great Britain Chapman amp Hall 1985 ISBN 0412989018 引文使用过时参数coauthor 帮助 van der Vaart Aad W Wellner Jon A Weak 