fbpx
维基百科

耦合 (概率)

耦合,或稱关联结构(英語:Copula),為处理统计中随机变量相关性问题的一种方法,由一组随机变量的邊際分布来确定它们的联合分布。通过关联结构来确定一个联合分布的方法是基于如下思想,一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成。这样,一个关联结构(dependence structure)就可以表达为一个基于上述所得平均分布之上的联合分布,而关联结构(copula)即是边缘均匀随机变量之上的一个联合分布。在实际应用中,上述的转换可能被设置为每个边缘变量的初始化步骤,或者上述转换的参数可能根据具体关联结构的对应参数设置。

按照所表达的关联关系的不同,关联结构被分为很多不同类别。典型情况下,一个种类的关联结构有多个参数用来表达不同的关联强度和关联类型。下面将大概描述一些有代表性的关联结构。关联结构的一个典型应用是,通过选择某一种类的关联结构来定义某一适合特定样本数据分布的联合分布,当然关联结构也可以来自于任何相应的给定联合分布。

基本思想

考察两个随机变量X,Y,分别具有连续累积分布函数FXFY。通过分别在两个随机变量上应用概率积分转换,得到X’ = FXX) 和Y’ = FYY)。因此X’Y’都是具有连续均匀分布的变量,相关性通常取决于XY是否是相关(自然,如果XY是不相关的,那么X’Y’也是不相关的)。因为这个转换是可逆的,可以定义XY之间的相关性等于X’Y’之间的相关性。因为X’Y’是均匀分布的随机变量,所以问题被简化为定义一个在两个均匀分布之上的二项分布,这就是关联结构。所以,这一基本思想就是,通过把边缘变量转化为均匀分布变量而不再需要考察很多不同的边缘分布以简化问题,然后再把相关性定义为一个在均匀分布之上的联合分布。

定义

一个 关联结构是一个定义在n单位立方体[0, 1]n上的多元联合分布,其每个边缘分布都是在[0, 1]区间上的均匀分布

特别的, 是一个n维关联结构,有

  有至少一个分量为 
  所有分量为 除了第i个分量等于 
 是n维递增的,也即,有每个hyperrectangle  
 

其中  所谓的 C-体积(volume)。

Sklar定理

由Sklar提出的这条定理[1]是大多数关联结构的应用的基础。Sklar定理指出,一个给定的p个变量的联合分布函数HF1, F2,F3,...Fp为其边缘分布函数,必存在这样一个关联结构C使H = CF1, F2,F3,...Fp

二项分布为例,Sklar定理应用如下。对任一二项分布函数Hxy),令Fx) = Hx, ∞) 而Gy) = H(∞, y) 为其单变量边缘概率分布函数。那么存在关联结构C以使

 

(此处已知分布C和它的累积分布函数)。此外,如果边缘分布Fx) 和Gy)连续,那么关联结构函数C是唯一的。否则,关联结构C在边缘分布的值域上是唯一确定的。

弗雷歇–霍夫丁(Fréchet–Hoeffding)关联结构边界

 
Graphs of the Fréchet–Hoeffding copula limits and of the independence copula (in the middle).

最小(反单调)关联结构:是所有关联结构的下边界。仅在二项分布中,变量间表现为完全负相关。

 

n-元关联结构,下边界为

 

最大 (共单调 ) 关联结构:是所有关联结构的上边界。其在二项分布中,变量间表现为完全正相关:

 

n-元关联结构,上边界为

 

结论:对所有关联结构Cuv),

 

对于多元关联的情况为

 

关联结构种类

正态关联结构

 
Cumulative distribution and probability density functions of Gaussian copula with ρ = 0.4

在金融建模中常用到的一个关联结构是正态关联结构,正态关联结构是根据Sklar定理由二元正态分布构成。设 是标准二元正态累积分布函数,相关系数ρ,则正态关联结构函数为

 

其中,  表示标准正态累积分布函数

C微分得出关联结构的密度函数:

 

其中

 

皮尔逊矩相关系数ρ标准二元正态分布的概率密度函数,其标准正态密度为 

参考资料

  1. ^ Sklar, A. Fonctions de répartition à n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris. 1959, 8: 229–231. 

耦合, 概率, 关于与, 標題相近或相同的条目, 請見, 耦合, 耦合, 或稱关联结构, 英語, copula, 為处理统计中随机变量相关性问题的一种方法, 由一组随机变量的邊際分布来确定它们的联合分布, 通过关联结构来确定一个联合分布的方法是基于如下思想, 一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成, 这样, 一个关联结构, dependence, structure, 就可以表达为一个基于上述所得平均分布之上的联合分布, 而关联结构, copula, 即是边缘均匀随机变量之上的一个联合分布. 关于与 耦合 概率 標題相近或相同的条目 請見 耦合 耦合 或稱关联结构 英語 Copula 為处理统计中随机变量相关性问题的一种方法 由一组随机变量的邊際分布来确定它们的联合分布 通过关联结构来确定一个联合分布的方法是基于如下思想 一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成 这样 一个关联结构 dependence structure 就可以表达为一个基于上述所得平均分布之上的联合分布 而关联结构 copula 即是边缘均匀随机变量之上的一个联合分布 在实际应用中 上述的转换可能被设置为每个边缘变量的初始化步骤 或者上述转换的参数可能根据具体关联结构的对应参数设置 按照所表达的关联关系的不同 关联结构被分为很多不同类别 典型情况下 一个种类的关联结构有多个参数用来表达不同的关联强度和关联类型 下面将大概描述一些有代表性的关联结构 关联结构的一个典型应用是 通过选择某一种类的关联结构来定义某一适合特定样本数据分布的联合分布 当然关联结构也可以来自于任何相应的给定联合分布 目录 1 基本思想 2 定义 3 Sklar定理 4 弗雷歇 霍夫丁 Frechet Hoeffding 关联结构边界 5 关联结构种类 5 1 正态关联结构 6 参考资料基本思想 编辑考察两个随机变量X Y 分别具有连续累积分布函数FX和FY 通过分别在两个随机变量上应用概率积分转换 得到X FX X 和Y FY Y 因此X 和Y 都是具有连续均匀分布的变量 相关性通常取决于X和Y是否是相关 自然 如果X和Y是不相关的 那么X 和Y 也是不相关的 因为这个转换是可逆的 可以定义X和Y之间的相关性等于X 和Y 之间的相关性 因为X 和Y 是均匀分布的随机变量 所以问题被简化为定义一个在两个均匀分布之上的二项分布 这就是关联结构 所以 这一基本思想就是 通过把边缘变量转化为均匀分布变量而不再需要考察很多不同的边缘分布以简化问题 然后再把相关性定义为一个在均匀分布之上的联合分布 定义 编辑一个 关联结构是一个定义在n维单位立方体 0 1 n上的多元联合分布 其每个边缘分布都是在 0 1 区间上的均匀分布 特别的 C 0 1 n 0 1 displaystyle C 0 1 n to 0 1 是一个n维关联结构 有 C u 0 displaystyle C left mathbf u right 0 当u 0 1 n displaystyle mathbf u in 0 1 n 有至少一个分量为0 displaystyle 0 C u u i displaystyle C left mathbf u right u i 当u 0 1 n displaystyle mathbf u in 0 1 n 所有分量为1 displaystyle 1 除了第i个分量等于u i displaystyle u i C u displaystyle C left mathbf u right 是n维递增的 也即 有每个hyperrectangle B i 1 n x i y i 0 1 n displaystyle B times i 1 n x i y i subseteq 0 1 n V C B z i 1 n x i y i 1 N z C z 0 displaystyle V C left B right sum mathbf z in times i 1 n x i y i 1 N mathbf z C mathbf z geq 0 其中N z card k z k x k displaystyle N mathbf z operatorname card k mid z k x k V C B displaystyle V C left B right 所谓的B displaystyle B 的C 体积 volume Sklar定理 编辑由Sklar提出的这条定理 1 是大多数关联结构的应用的基础 Sklar定理指出 一个给定的p个变量的联合分布函数H F1 F2 F3 Fp为其边缘分布函数 必存在这样一个关联结构C使H C F1 F2 F3 Fp 以二项分布为例 Sklar定理应用如下 对任一二项分布函数H x y 令F x H x 而G y H y 为其单变量边缘概率分布函数 那么存在关联结构C以使 H x y C F x G y displaystyle H x y C F x G y 此处已知分布C和它的累积分布函数 此外 如果边缘分布F x 和G y 连续 那么关联结构函数C是唯一的 否则 关联结构C在边缘分布的值域上是唯一确定的 弗雷歇 霍夫丁 Frechet Hoeffding 关联结构边界 编辑 Graphs of the Frechet Hoeffding copula limits and of the independence copula in the middle 最小 反单调 关联结构 是所有关联结构的下边界 仅在二项分布中 变量间表现为完全负相关 W u v max 0 u v 1 displaystyle W u v max 0 u v 1 对n 元关联结构 下边界为 W u 1 u n max 1 n i 1 n u i 0 C u 1 u n displaystyle W u 1 ldots u n max left 1 n sum limits i 1 n u i 0 right leq C u 1 ldots u n 最大 共单调 关联结构 是所有关联结构的上边界 其在二项分布中 变量间表现为完全正相关 M u v min u v displaystyle M u v min u v 对n 元关联结构 上边界为 C u 1 u n min j 1 n u j M u 1 u n displaystyle C u 1 ldots u n leq min j in 1 ldots n u j M u 1 ldots u n 结论 对所有关联结构C u v W u v C u v M u v displaystyle W u v leq C u v leq M u v 对于多元关联的情况为 W u 1 u n C u 1 u n M u 1 u n displaystyle W u 1 ldots u n leq C u 1 ldots u n leq M u 1 ldots u n 关联结构种类 编辑正态关联结构 编辑 Cumulative distribution and probability density functions of Gaussian copula with r 0 4 在金融建模中常用到的一个关联结构是正态关联结构 正态关联结构是根据Sklar定理由二元正态分布构成 设F r displaystyle Phi rho 是标准二元正态累积分布函数 相关系数为r 则正态关联结构函数为 C r u v F r F 1 u F 1 v displaystyle C rho u v Phi rho left Phi 1 u Phi 1 v right 其中 u v 0 1 displaystyle u v in 0 1 而F displaystyle Phi 表示标准正态累积分布函数 对C微分得出关联结构的密度函数 c r u v f X Y r F 1 u F 1 v f F 1 u f F 1 v displaystyle c rho u v frac varphi X Y rho Phi 1 u Phi 1 v varphi Phi 1 u varphi Phi 1 v 其中 f X Y r x y 1 2 p 1 r 2 exp 1 2 1 r 2 x 2 y 2 2 r x y displaystyle varphi X Y rho x y frac 1 2 pi sqrt 1 rho 2 exp left frac 1 2 1 rho 2 left x 2 y 2 2 rho xy right right 是皮尔逊矩相关系数为r标准二元正态分布的概率密度函数 其标准正态密度为f displaystyle varphi 参考资料 编辑 Sklar A Fonctions de repartition a n dimensions et leurs marges Publ Inst Statist Univ Paris 1959 8 229 231 取自 https zh wikipedia org w index php title 耦合 概率 amp oldid 70698523, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。