fbpx
维基百科

沃瑟斯坦度量

沃瑟斯坦度量(英語:Wasserstein metric)又称为沃瑟斯坦距离Wasserstein distance)、坎托罗维奇–鲁宾施泰因度量Kantorovich–Rubinstein metric),在数学中是指某一给定度量空间概率分布之间的距离函数,其名称源于俄裔美国数学家列昂尼德·沃瑟斯坦英语Leonid Vaserstein

直观而言,可以将每个概率分布都看作上堆积的单位数量的土堆,则沃瑟斯坦度量便是指将一个土堆变成另一土堆的最小代价,可定义为需要移动的土壤量乘以需要移动的平均距离。这一问题于1781年由法国数学家加斯帕尔·蒙日首次正式提出。基于上述土堆类比,该度量在计算机科学中也被称为推土机距离

“沃瑟斯坦距离”这一名称是苏联数学家罗兰·多布鲁申英语Roland Dobrushin于1970年提出的,他在沃瑟斯坦关于描述大型自动机系统的马尔可夫过程的工作中了解到了这一概念。[1]不过早在1939年,另一位苏联数学家列昂尼德·坎托罗维奇就在研究货物的最优运输问题时最早定义了该度量。[2]因此一些学者认为使用“坎托罗维奇度量”或“坎托罗维奇距离”来称呼此度量更为恰当。

定义 编辑

对于一个度量空间 ,假设 上每个博雷尔概率测度都是拉东测度(即该度量空间为拉东空间)。对有限  表示 上所有有 的概率测度 的集合,即 中存在 满足

 

于是, 中两个概率测度  之间的 沃瑟斯坦距离可定义为

 

其中 表示 上所有测度的集合,即  的所有耦合英语Coupling (probability)组成的集合。

此外,沃瑟斯坦度量也可等效地定义为

 

其中 表示随机变量 期望值下确界则由随机变量  的所有联合分布确定,它们分别对应边缘分布  

与最优运输问题的联系 编辑

 
x轴与y轴上分别绘有两个一维分布  ,中间是两者一种可能的联合分布(不唯一),而这一联合分布即定义了  之间的一个运输方案。

理解上述定义的一种方法是将其与最优运输问题联系起来。对于空间 上的某一质量分布 ,我们希望以某种方式运输其质量,使其转化同一个空间中的另一分布 ,即将“土堆” 转换为“土堆” 。两者的总质量必须相同,因而可以不失一般性地假设  是总质量为1的概率分布。此外还需假设代价函数

 

表示从点 运输质量到点 的代价。一个从  的运输方案可以用函数 来描述,该函数表明从 移动到 的质量。一个运输方案 必须满足以下性质

 

前者表示从某一点 移到其他所有点的土堆总质量必须等于最初该点 上的土堆质量,后者则表示从所有点移到某一点 的土堆总质量必须等于最终该点 上的土堆质量。

这一性质相当于要求 是边缘分布  对应的联合概率分布。于是可得到运输方案 的总代价

 

方案 并不是唯一的,所有可能的运输方案中代价最低的方案即为最优运输方案。最优运输方案的代价为

 

如果两点之间移动的代价等于两点之间的距离,那么最小代价则与 距离等价。

参考文献 编辑

  1. ^ Vaserstein LN. Markov processes over denumerable products of spaces, describing large systems of automata (PDF). Problemy Peredači Informacii. 1969, 5 (3): 64–72. 
  2. ^ Kantorovich LV. Mathematical Methods of Organizing and Planning Production. Management Science. 1939, 6 (4): 366–422. JSTOR 2627082. doi:10.1287/mnsc.6.4.366. 

沃瑟斯坦度量, 英語, wasserstein, metric, 又称为沃瑟斯坦距离, wasserstein, distance, 坎托罗维奇, 鲁宾施泰因度量, kantorovich, rubinstein, metric, 在数学中是指某一给定度量空间m, displaystyle, 上概率分布之间的距离函数, 其名称源于俄裔美国数学家列昂尼德, 沃瑟斯坦, 英语, leonid, vaserstein, 直观而言, 可以将每个概率分布都看作m, displaystyle, 上堆积的单位数量的土堆, 则便是. 沃瑟斯坦度量 英語 Wasserstein metric 又称为沃瑟斯坦距离 Wasserstein distance 坎托罗维奇 鲁宾施泰因度量 Kantorovich Rubinstein metric 在数学中是指某一给定度量空间M displaystyle M 上概率分布之间的距离函数 其名称源于俄裔美国数学家列昂尼德 沃瑟斯坦 英语 Leonid Vaserstein 直观而言 可以将每个概率分布都看作M displaystyle M 上堆积的单位数量的土堆 则沃瑟斯坦度量便是指将一个土堆变成另一土堆的最小代价 可定义为需要移动的土壤量乘以需要移动的平均距离 这一问题于1781年由法国数学家加斯帕尔 蒙日首次正式提出 基于上述土堆类比 该度量在计算机科学中也被称为推土机距离 沃瑟斯坦距离 这一名称是苏联数学家罗兰 多布鲁申 英语 Roland Dobrushin 于1970年提出的 他在沃瑟斯坦关于描述大型自动机系统的马尔可夫过程的工作中了解到了这一概念 1 不过早在1939年 另一位苏联数学家列昂尼德 坎托罗维奇就在研究货物的最优运输问题时最早定义了该度量 2 因此一些学者认为使用 坎托罗维奇度量 或 坎托罗维奇距离 来称呼此度量更为恰当 定义 编辑对于一个度量空间 M d displaystyle M d nbsp 假设M displaystyle M nbsp 上每个博雷尔概率测度都是拉东测度 即该度量空间为拉东空间 对有限p 1 displaystyle p geq 1 nbsp P p M displaystyle P p M nbsp 表示M displaystyle M nbsp 上所有有p displaystyle p nbsp 阶矩的概率测度m displaystyle mu nbsp 的集合 即M displaystyle M nbsp 中存在x 0 displaystyle x 0 nbsp 满足 M d x x 0 p d m x lt displaystyle int M d x x 0 p mathrm d mu x lt infty nbsp 于是 P p M displaystyle P p M nbsp 中两个概率测度m displaystyle mu nbsp 和n displaystyle nu nbsp 之间的p displaystyle p nbsp 阶沃瑟斯坦距离可定义为 W p m n inf g G m n M M d x y p d g x y 1 p displaystyle W p mu nu left inf gamma in Gamma mu nu int M times M d x y p mathrm d gamma x y right 1 p nbsp 其中G m n displaystyle Gamma mu nu nbsp 表示M M displaystyle M times M nbsp 上所有测度的集合 即m displaystyle mu nbsp 与n displaystyle nu nbsp 的所有耦合 英语 Coupling probability 组成的集合 此外 沃瑟斯坦度量也可等效地定义为 W p m n inf E d X Y p 1 p displaystyle W p mu nu left inf operatorname mathbf E big d X Y p big right 1 p nbsp 其中E Z displaystyle mathbf E Z nbsp 表示随机变量Z displaystyle Z nbsp 的期望值 下确界则由随机变量X displaystyle X nbsp 和Y displaystyle Y nbsp 的所有联合分布确定 它们分别对应边缘分布m displaystyle mu nbsp 和n displaystyle nu nbsp 与最优运输问题的联系 编辑 nbsp x轴与y轴上分别绘有两个一维分布m displaystyle mu nbsp 和n displaystyle nu nbsp 中间是两者一种可能的联合分布 不唯一 而这一联合分布即定义了m displaystyle mu nbsp 和n displaystyle nu nbsp 之间的一个运输方案 理解上述定义的一种方法是将其与最优运输问题联系起来 对于空间X displaystyle X nbsp 上的某一质量分布m x displaystyle mu x nbsp 我们希望以某种方式运输其质量 使其转化同一个空间中的另一分布n x displaystyle nu x nbsp 即将 土堆 m displaystyle mu nbsp 转换为 土堆 n displaystyle nu nbsp 两者的总质量必须相同 因而可以不失一般性地假设m displaystyle mu nbsp 和n displaystyle nu nbsp 是总质量为1的概率分布 此外还需假设代价函数 c x y 0 displaystyle c x y mapsto 0 infty nbsp 表示从点x displaystyle x nbsp 运输质量到点y displaystyle y nbsp 的代价 一个从m displaystyle mu nbsp 到n displaystyle nu nbsp 的运输方案可以用函数g x y displaystyle gamma x y nbsp 来描述 该函数表明从x displaystyle x nbsp 移动到y displaystyle y nbsp 的质量 一个运输方案g x y displaystyle gamma x y nbsp 必须满足以下性质 g x y d y m x g x y d x n y displaystyle begin aligned int gamma x y mathrm d y mu x int gamma x y mathrm d x nu y end aligned nbsp 前者表示从某一点x displaystyle x nbsp 移到其他所有点的土堆总质量必须等于最初该点x displaystyle x nbsp 上的土堆质量 后者则表示从所有点移到某一点y displaystyle y nbsp 的土堆总质量必须等于最终该点y displaystyle y nbsp 上的土堆质量 这一性质相当于要求g displaystyle gamma nbsp 是边缘分布m displaystyle mu nbsp 与n displaystyle nu nbsp 对应的联合概率分布 于是可得到运输方案g displaystyle gamma nbsp 的总代价 c x y g x y d x d y c x y d g x y displaystyle iint c x y gamma x y mathrm d x mathrm d y int c x y mathrm d gamma x y nbsp 方案g displaystyle gamma nbsp 并不是唯一的 所有可能的运输方案中代价最低的方案即为最优运输方案 最优运输方案的代价为 C inf g G m n c x y d g x y displaystyle C inf gamma in Gamma mu nu int c x y mathrm d gamma x y nbsp 如果两点之间移动的代价等于两点之间的距离 那么最小代价则与W 1 displaystyle W 1 nbsp 距离等价 参考文献 编辑 Vaserstein LN Markov processes over denumerable products of spaces describing large systems of automata PDF Problemy Peredaci Informacii 1969 5 3 64 72 Kantorovich LV Mathematical Methods of Organizing and Planning Production Management Science 1939 6 4 366 422 JSTOR 2627082 doi 10 1287 mnsc 6 4 366 取自 https zh wikipedia org w index php title 沃瑟斯坦度量 amp oldid 81497022, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。