fbpx
维基百科

自助法

统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽樣法拔靴法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上發表。當樣本來自能以正态分布來描述的总体,其抽樣分布英语Sampling Distribution為正态分布;但當樣本來自的总體無法以正态分布來描述,則以漸進分析法、自助法等來分析。採用隨機可置換抽樣(random sampling with replacement)。对于小数据集,自助法效果很好。

.632自助法

最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

参见

参考文献

  1. 范明/孟小峰. 数据挖掘:概念与技术. 机械工业出版社. 2012年8月: 241. ISBN 978-7-111-39140-1 (中文). 

自助法, 在统计学中, bootstrap, method, bootstrapping, 或自助抽樣法, 拔靴法, 是一种从给定训练集中有放回的均匀抽样, 也就是说, 每当选中一个样本, 它等可能地被再次选中并被再次添加到训练集中, 由bradley, efron于1979年在, annals, statistics, 上發表, 當樣本來自能以正态分布來描述的总体, 其抽樣分布, 英语, sampling, distribution, 為正态分布, 但當樣本來自的总體無法以正态分布來描述, 則以漸進分析法, 等來. 在统计学中 自助法 Bootstrap Method Bootstrapping 或自助抽樣法 拔靴法 是一种从给定训练集中有放回的均匀抽样 也就是说 每当选中一个样本 它等可能地被再次选中并被再次添加到训练集中 自助法由Bradley Efron于1979年在 Annals of Statistics 上發表 當樣本來自能以正态分布來描述的总体 其抽樣分布 英语 Sampling Distribution 為正态分布 但當樣本來自的总體無法以正态分布來描述 則以漸進分析法 自助法等來分析 採用隨機可置換抽樣 random sampling with replacement 对于小数据集 自助法效果很好 632自助法 编辑最常用的一种是 632自助法 假设给定的数据集包含d个样本 该数据集有放回地抽样d次 产生d个样本的训练集 这样原数据样本中的某些样本很可能在该样本集中出现多次 没有进入该训练集的样本最终形成检验集 测试集 显然每个样本被选中的概率是1 d 因此未被选中的概率就是 1 1 d 这样一个样本在训练集中没出现的概率就是d次都未被选中的概率 即 1 1 d d 当d趋于无穷大时 这一概率就将趋近于e 1 0 368 所以留在训练集中的样本大概就占原来数据集的63 2 参见 编辑刀切法参考文献 编辑范明 孟小峰 数据挖掘 概念与技术 机械工业出版社 2012年8月 241 ISBN 978 7 111 39140 1 中文 取自 https zh wikipedia org w index php title 自助法 amp oldid 75036416, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。