fbpx
维基百科

可辨识性

统计学中可辨识是一个能够更为准确推断模型必须满足的属性。 一个模型是可辨识的,如果它在理论上能通过无限的观测结果学习到的真正该模型背后参数的真实值。 在数学上,这相当于说基于这些观测结果的不同的参数值必须产生不同的概率分布。 通常情况下,模型只是在某些情况下是可识别的,这些情况的限定条件被称为识别条件

一个模型是不可识别的,如果:两个或两个以上的参数化是观察等价的。 在某些情况下,即使一个模型是不可识别的,它仍然可能学习到某些特定模型参数子集的真实值。 在这种情况下,我们称该模型是部分地可识别的。 在其他情况下,模型可能可以学习到参数空间中一定有限区域的真的参数值,在这种情况下,该模型是集合可识别的。

除了严格的理论探索模型的属性,当使用可识别性分析使用实验数据集检验模型时,可识别性可以在一个更宽泛的范围内被提及。[1]

定义 编辑

  为一个 统计模型, 其中参数空间   可以是有限或无限维。 我们说  可识别的,如果映射  一一映射:[2]

这个定义意味着不同值的 θ 应当对应于不同的概率分布:如果 θ1θ2,那么也有 Pθ1Pθ2[3] 如果分布是以概率密度的函数(pdf)方式定义的,那么这两个概率密度函数只有在它们对于一个非零测度集合表现不同时被认为是不同的(例如两个函数ƒ1(x) = 10 ≤ x < 1和ƒ2(x) = 10 ≤ x ≤ 1 不同之处仅在一个单一点 x = 1—一个测度为零的集合--因此不能被视为不同的概率密度函数)。

模型的可辨识性在映射  的可逆性的意义上等价于能够在模型无限长的观察后学习模型的真实的参数值。事实上,如果{Xt} ⊆ S 是模型的观测序列,那么根据大数定律

 

对于每个可测量的集合A  ⊆   S (此处1 {...}指示函数 )。 因此,通过无限数量的观察,我们将能够在模型中找到真实概率分布P 0 ,并且由于上述可识别性条件需要映射 是可逆的,我们也能够找到产生给定分布P 0 的真实参数值。

例子 编辑

例1 编辑

 正态位置尺度族:

 

那么

 

对于几乎所有的 x 只有当其所有系数都等于零,该公式为零,唯一可能的情况是|σ1|=|σ2|且 μ1 = μ2。 由于在尺度参数 σ 是限制大于零的,我们得出结论,该模型是可辨识的:ƒθ1 = ƒθ2θ1 = θ2

例2 编辑

  为标准 线性回归模型

 

(其中,'表示矩阵转置)。 参数 β 是可辨识的,当且仅当矩阵   是可逆的。 因此,这是该模型的可辨识条件

例3 编辑

假设   是经典的变量误差线性模型:

 

其中,(ε,η,x*) 是联合正态独立随机变量,其期望为零,方差未知,只有变量(x,y)是观察到的。 那么这个模型是不可识别的,[4] 只有积βσ2 (其中σ²是差异的潜在回归量 x*)。这也是一个集合可识别的模式的例子:虽然确切的 β 值无法被学习到,我们可以保证,它一定在 (βy,1÷βx-y) 区间中的某处,其中, βyx 是y关于x 的普通最小二乘法 回归的系数,并且 βxy 也是 x 关于 y 的普通最小二乘法回归的系数。[5]

如果我们放弃正态假设并且要求 x* 不是正态分布,仅保留独立的条件 ε ⊥ η ⊥ x*,那么该模型成为可以识别的。[4]

软件 编辑

在可部分地观察的动力系统的参数估计情况下, 似然函数也可以被用于结构性和实际可识别性分析。[6] 关于 [1] (页面存档备份,存于互联网档案馆)的一个实现可以在MATLAB工具箱 PottersWheel中获取。

参考 编辑

参考文献 编辑

引文 编辑

  1. ^ Raue, A.; Kreutz, C.; Maiwald, T.; Bachmann, J.; Schilling, M.; Klingmuller, U.; Timmer, J. Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood. Bioinformatics. 2009-08-01, 25 (15): 1923–1929. PMID 19505944. doi:10.1093/bioinformatics/btp358. 
  2. ^ Lehmann & Casella 1998
  3. ^ van der Vaart 1998
  4. ^ 4.0 4.1 Reiersøl 1950
  5. ^ Casella & Berger 2001
  6. ^ Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J, Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood, Bioinformatics, 2009, 25 (15): 1923–9 [2019-05-16], PMID 19505944, doi:10.1093/bioinformatics/btp358, (原始内容存档于2013-01-13). 

来源 编辑

  • Casella, George; Berger, Roger L., Statistical Inference 2nd, 2002, ISBN 0-534-24312-6, LCCN 2001025794 
  • Hsiao, Cheng, Identification, Handbook of Econometrics, Vol. 1, Ch.4, North-Holland Publishing Company, 1983 
  • Lehmann, E. L.; Casella, G., Theory of Point Estimation 2nd, Springer, 1998, ISBN 0-387-98502-6 
  • Reiersøl, Olav, Identifiability of a linear relation between variables which are subject to error, Econometrica, 1950, 18 (4): 375–389, JSTOR 1907835, doi:10.2307/1907835 
  • van der Vaart, A. W., Asymptotic Statistics, Cambridge University Press, 1998, ISBN 978-0-521-49603-2 

进一步阅读 编辑

  • Walter, É.; Pronzato, L., Identification of Parametric Models from Experimental Data, Springer, 1997 

可辨识性, 此條目翻譯品質不佳, 2019年5月16日, 翻譯者可能不熟悉中文或原文語言, 也可能使用了機器翻譯, 請協助翻譯本條目或重新編寫, 并注意避免翻译腔的问题, 明顯拙劣的翻譯請改掛, href, template, html, class, redirect, title, template, href, wikipedia, html, class, redirect, title, wikipedia, 提交刪除, 此条目序言章节没有充分总结其内容要点, 2019年5月16日, 请考虑扩充序言, 为. 此條目翻譯品質不佳 2019年5月16日 翻譯者可能不熟悉中文或原文語言 也可能使用了機器翻譯 請協助翻譯本條目或重新編寫 并注意避免翻译腔的问题 明顯拙劣的翻譯請改掛 a href Template D html class mw redirect title Template D d a a href Wikipedia CSD html G13 class mw redirect title Wikipedia CSD G13 a 提交刪除 此条目序言章节没有充分总结其内容要点 2019年5月16日 请考虑扩充序言 为条目所有重要方面提供易懂的概述 请在条目的讨论页讨论此问题 在 统计学中 可辨识是一个能够更为准确推断的模型必须满足的属性 一个模型是可辨识的 如果它在理论上能通过无限的观测结果学习到的真正该模型背后参数的真实值 在数学上 这相当于说基于这些观测结果的不同的参数值必须产生不同的概率分布 通常情况下 模型只是在某些情况下是可识别的 这些情况的限定条件被称为识别条件 一个模型是不可识别的 如果 两个或两个以上的参数化是观察等价的 在某些情况下 即使一个模型是不可识别的 它仍然可能学习到某些特定模型参数子集的真实值 在这种情况下 我们称该模型是部分地可识别的 在其他情况下 模型可能可以学习到参数空间中一定有限区域的真的参数值 在这种情况下 该模型是集合可识别的 除了严格的理论探索模型的属性 当使用可识别性分析使用实验数据集检验模型时 可识别性可以在一个更宽泛的范围内被提及 1 目录 1 定义 2 例子 2 1 例1 2 2 例2 2 3 例3 3 软件 4 参考 5 参考文献 5 1 引文 5 2 来源 6 进一步阅读定义 编辑令 P P 8 8 8 displaystyle mathcal P P theta theta in Theta nbsp 为一个 统计模型 其中参数空间 8 displaystyle Theta nbsp 可以是有限或无限维 我们说 P displaystyle mathcal P nbsp 是可识别的 如果映射 8 P 8 displaystyle theta mapsto P theta nbsp 是 一一映射 2 这个定义意味着不同值的 8 应当对应于不同的概率分布 如果 81 82 那么也有 P81 P82 3 如果分布是以概率密度的函数 pdf 方式定义的 那么这两个概率密度函数只有在它们对于一个非零测度集合表现不同时被认为是不同的 例如两个函数ƒ1 x 10 x lt 1和ƒ2 x 10 x 1 不同之处仅在一个单一点 x 1 一个测度为零的集合 因此不能被视为不同的概率密度函数 模型的可辨识性在映射 8 P 8 displaystyle theta mapsto P theta nbsp 的可逆性的意义上等价于能够在模型无限长的观察后学习模型的真实的参数值 事实上 如果 Xt S 是模型的观测序列 那么根据大数定律 1 T t 1 T 1 X t A a s Pr X t A displaystyle frac 1 T sum t 1 T mathbf 1 X t in A xrightarrow text a s Pr X t in A nbsp 对于每个可测量的集合A S 此处1 是指示函数 因此 通过无限数量的观察 我们将能够在模型中找到真实概率分布P 0 并且由于上述可识别性条件需要映射8 P 8 displaystyle theta mapsto P theta nbsp 是可逆的 我们也能够找到产生给定分布P 0 的真实参数值 例子 编辑例1 编辑 令 P displaystyle mathcal P nbsp 是正态位置尺度族 P f 8 x 1 2 p s e 1 2 s 2 x m 2 8 m s m R s gt 0 displaystyle mathcal P Big f theta x tfrac 1 sqrt 2 pi sigma e frac 1 2 sigma 2 x mu 2 Big theta mu sigma mu in mathbb R sigma gt 0 Big nbsp 那么 f 8 1 f 8 2 1 2 p s 1 exp 1 2 s 1 2 x m 1 2 1 2 p s 2 exp 1 2 s 2 2 x m 2 2 1 s 1 2 x m 1 2 ln s 1 1 s 2 2 x m 2 2 ln s 2 x 2 1 s 1 2 1 s 2 2 2 x m 1 s 1 2 m 2 s 2 2 m 1 2 s 1 2 m 2 2 s 2 2 ln s 1 ln s 2 0 displaystyle begin aligned amp f theta 1 f theta 2 6pt Longleftrightarrow amp frac 1 sqrt 2 pi sigma 1 exp left frac 1 2 sigma 1 2 x mu 1 2 right frac 1 sqrt 2 pi sigma 2 exp left frac 1 2 sigma 2 2 x mu 2 2 right 6pt Longleftrightarrow amp frac 1 sigma 1 2 x mu 1 2 ln sigma 1 frac 1 sigma 2 2 x mu 2 2 ln sigma 2 6pt Longleftrightarrow amp x 2 left frac 1 sigma 1 2 frac 1 sigma 2 2 right 2x left frac mu 1 sigma 1 2 frac mu 2 sigma 2 2 right left frac mu 1 2 sigma 1 2 frac mu 2 2 sigma 2 2 ln sigma 1 ln sigma 2 right 0 end aligned nbsp 对于几乎所有的 x 只有当其所有系数都等于零 该公式为零 唯一可能的情况是 s1 s2 且 m1 m2 由于在尺度参数 s 是限制大于零的 我们得出结论 该模型是可辨识的 ƒ81 ƒ82 81 82 例2 编辑 令 P displaystyle mathcal P nbsp 为标准 线性回归模型 y b x e E e x 0 displaystyle y beta x varepsilon quad mathrm E varepsilon mid x 0 nbsp 其中 表示矩阵转置 参数 b 是可辨识的 当且仅当矩阵 E x x displaystyle mathrm E xx nbsp 是可逆的 因此 这是该模型的可辨识条件 例3 编辑 假设 P displaystyle mathcal P nbsp 是经典的变量误差线性模型 y b x e x x h displaystyle begin cases y beta x varepsilon x x eta end cases nbsp 其中 e h x 是联合正态独立随机变量 其期望为零 方差未知 只有变量 x y 是观察到的 那么这个模型是不可识别的 4 只有积bs2 其中s 是差异的潜在回归量 x 这也是一个集合可识别的模式的例子 虽然确切的 b 值无法被学习到 我们可以保证 它一定在 by 1 bx y 区间中的某处 其中 byx 是y关于x 的普通最小二乘法 回归的系数 并且 bxy 也是 x 关于 y 的普通最小二乘法回归的系数 5 如果我们放弃正态假设并且要求 x 不是正态分布 仅保留独立的条件 e h x 那么该模型成为可以识别的 4 软件 编辑在可部分地观察的动力系统的参数估计情况下 似然函数也可以被用于结构性和实际可识别性分析 6 关于 1 页面存档备份 存于互联网档案馆 的一个实现可以在MATLAB工具箱 PottersWheel中获取 参考 编辑可觀測性 系統識別参考文献 编辑引文 编辑 Raue A Kreutz C Maiwald T Bachmann J Schilling M Klingmuller U Timmer J Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood Bioinformatics 2009 08 01 25 15 1923 1929 PMID 19505944 doi 10 1093 bioinformatics btp358 Lehmann amp Casella 1998 van der Vaart 1998 4 0 4 1 Reiersol 1950 Casella amp Berger 2001harvnb error no target CITEREFCasellaBerger2001 help Raue A Kreutz C Maiwald T Bachmann J Schilling M Klingmuller U Timmer J Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood Bioinformatics 2009 25 15 1923 9 2019 05 16 PMID 19505944 doi 10 1093 bioinformatics btp358 原始内容存档于2013 01 13 来源 编辑 Casella George Berger Roger L Statistical Inference 2nd 2002 ISBN 0 534 24312 6 LCCN 2001025794 Hsiao Cheng Identification Handbook of Econometrics Vol 1 Ch 4 North Holland Publishing Company 1983 Lehmann E L Casella G Theory of Point Estimation 2nd Springer 1998 ISBN 0 387 98502 6 Reiersol Olav Identifiability of a linear relation between variables which are subject to error Econometrica 1950 18 4 375 389 JSTOR 1907835 doi 10 2307 1907835 van der Vaart A W Asymptotic Statistics Cambridge University Press 1998 ISBN 978 0 521 49603 2 进一步阅读 编辑Walter E Pronzato L Identification of Parametric Models from Experimental Data Springer 1997 取自 https zh wikipedia org w index php title 可辨识性 amp oldid 78988549, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。