fbpx
维基百科

马哈拉诺比斯距离

马哈拉诺比斯距离(Mahalanobis distance)是由印度统计学家普拉桑塔·钱德拉·马哈拉诺比斯英语Prasanta Chandra Mahalanobis提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。 对于一个均值为协方差矩阵的多变量向量,其马氏距离为

马哈拉诺比斯距离也可以定义为两个服从同一分布并且其协方差矩阵为的随机变量的差异程度:

如果协方差矩阵为单位矩阵,马哈拉诺比斯距离就简化为欧氏距离;如果协方差矩阵为对角阵,其也可称为正规化的欧氏距离

其中标准差

意义

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

马哈拉诺比斯距离, 此條目没有列出任何参考或来源, 2020年4月26日, 維基百科所有的內容都應該可供查證, 请协助補充可靠来源以改善这篇条目, 无法查证的內容可能會因為異議提出而移除, mahalanobis, distance, 是由印度统计学家普拉桑塔, 钱德拉, 马哈拉诺比斯, 英语, prasanta, chandra, mahalanobis, 提出的, 表示数据的协方差距离, 它是一种有效的计算两个未知样本集的相似度的方法, 与欧氏距离不同的是它考虑到各种特性之间的联系, 例如, 一条关于身高的信息. 此條目没有列出任何参考或来源 2020年4月26日 維基百科所有的內容都應該可供查證 请协助補充可靠来源以改善这篇条目 无法查证的內容可能會因為異議提出而移除 马哈拉诺比斯距离 Mahalanobis distance 是由印度统计学家普拉桑塔 钱德拉 马哈拉诺比斯 英语 Prasanta Chandra Mahalanobis 提出的 表示数据的协方差距离 它是一种有效的计算两个未知样本集的相似度的方法 与欧氏距离不同的是它考虑到各种特性之间的联系 例如 一条关于身高的信息会带来一条关于体重的信息 因为两者是有关联的 并且是尺度无关的 scale invariant 即独立于测量尺度 对于一个均值为m m 1 m 2 m 3 m p T displaystyle mu mu 1 mu 2 mu 3 dots mu p T 协方差矩阵为S displaystyle Sigma 的多变量向量x x 1 x 2 x 3 x p T displaystyle x x 1 x 2 x 3 dots x p T 其马氏距离为 D M x x m T S 1 x m displaystyle D M vec x sqrt vec x vec mu T Sigma 1 vec x vec mu 马哈拉诺比斯距离也可以定义为两个服从同一分布并且其协方差矩阵为S displaystyle Sigma 的随机变量x displaystyle vec x 与y displaystyle vec y 的差异程度 d x y x y T S 1 x y displaystyle d vec x vec y sqrt vec x vec y T Sigma 1 vec x vec y 如果协方差矩阵为单位矩阵 马哈拉诺比斯距离就简化为欧氏距离 如果协方差矩阵为对角阵 其也可称为正规化的欧氏距离 d x y i 1 p x i y i 2 s i 2 displaystyle d vec x vec y sqrt sum i 1 p x i y i 2 over sigma i 2 其中s i displaystyle sigma i 是x i displaystyle x i 的标准差 意义 编辑马哈拉诺比斯距离是基于样本分布的一种距离 物理意义就是在规范化的主成分空间中的欧氏距离 所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解 再对所有主成分分解轴做归一化 形成新的坐标轴 由这些坐标轴张成的空间就是规范化的主成分空间 换句话说 主成分分析就是把椭球分布的样本改变到另一个空间里 使其成为球状分布 而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离 当然 上面的解释只是对椭球分布而言 对一般分布 只能消除分布的二阶相关性 而不能消除高阶相关性 这是一篇與統計學相關的小作品 你可以通过编辑或修订扩充其内容 查论编 取自 https zh wikipedia org w index php title 马哈拉诺比斯距离 amp oldid 74893156, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。