fbpx
维基百科

大间隔最近邻居

大间隔最近邻居(Large margin nearest neighbor (LMNN)分类算法是统计学的一种机器学习算法。该算法是在近邻分类其中学习一种欧式距离度量函数。该度量函数优化的目标是:对于一个输入个近邻都属于同一类别,而不同类别的样本与保持一定大的距离。近邻规则是模式识别领域广泛使用的一种简单有效的方法。它的效果的好坏只依赖于确定最近邻的距离度量。基于欧式距离度量学习函数的大间隔最近邻居分类算法能够很好的改善近邻算法分类效果。[1]

定义 编辑

大间隔最近邻居算法的主要想法就是通过学习一种距离度量使得在一个新的转换空间中,对于一个输入  个近邻都属于同一类别,而不同类别的样本与 保持一定大的距离。如果该想法能够实现则留一(LOO)分类错误率将会最小化。该算法的最主要的任务就是求得满足条件的线性空间转换矩阵 。 定义有类别标签的训练数据集为: , 其中类别标签集为: . 我们的目标是学习一种用来估计如下平方距离的线性变换  

其中 是半正定矩阵。欧氏距离是该距离度量的特例( 为单位矩阵的形式)。该度量算法也被称作是马氏距离度量(Mahalanobis Metric)。 图1显示了,该算法的学习过程:

 
Figure 1: Schematic illustration of LMNN.

目标邻居的定义 编辑

对于每一个输入样本 ,除了要知道其类别标签 外,还需要确定其 个目标邻居,即 个同类别的输入,并且希望通过上式求出的距离最小。当缺乏先验知识的话,属于同类别的目标邻居可以由欧氏距离确定。则属于同类别的 个的输入即为目标邻居。

入侵样本的定义 编辑

对于任何一个输入样本 ,其入侵样本是指与其最近邻的 个样本中与其不同类的样本。该算法在对训练样本学习过程中应尽可能的使入侵样本的数目达到最小化。

算法 编辑

大间隔最近邻居算法的转换矩阵 可以通过半定规划得到优化。该算法的目标是:对于每一个输入样本,其 个目标邻居应尽可能的接近,而那些入侵样本应尽可能的远离该输入样本(即与其保持一定大的距离间隔)。图1显示了该算法的学习过程,通过学习使得输入向量 被其目标近邻包围。对于一个测试样本,我们取 为3的最近邻规则。 第一个优化的目标是实现输入样本 与其目标近邻的平均距离的最小化:  .

第二个优化的目标是使输入样本 到其目标邻居的距离与其到入侵近邻的距离至少保持1个单位的间隔。该约束可以表示为:  

因此,最终的优化问题可以表示为:

 
 
 
 
 

其中 为半定矩阵。

参考文献 编辑

  1. ^ Weinberger, K. Q.; Blitzer J. C., Saul L. K. (PDF). Advances in Neural Information Processing Systems 18 (NIPS). 2006: 1473–1480 [2012-05-19]. (原始内容 (PDF)存档于2011-01-15). 

外部链接 编辑

大间隔最近邻居, 此條目需要补充更多来源, 2012年5月20日, 请协助補充多方面可靠来源以改善这篇条目, 无法查证的内容可能會因為异议提出而被移除, 致使用者, 请搜索一下条目的标题, 来源搜索, 网页, 新闻, 书籍, 学术, 图像, 以检查网络上是否存在该主题的更多可靠来源, 判定指引, large, margin, nearest, neighbor, lmnn, 分类算法是统计学的一种机器学习算法, 该算法是在k, displaystyle, 近邻分类其中学习一种欧式距离度量函数, 该度量函数优化的目标. 此條目需要补充更多来源 2012年5月20日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而被移除 致使用者 请搜索一下条目的标题 来源搜索 大间隔最近邻居 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 大间隔最近邻居 Large margin nearest neighbor LMNN 分类算法是统计学的一种机器学习算法 该算法是在k displaystyle k 近邻分类其中学习一种欧式距离度量函数 该度量函数优化的目标是 对于一个输入x i displaystyle x i 的k displaystyle k 个近邻都属于同一类别 而不同类别的样本与x i displaystyle x i 保持一定大的距离 k displaystyle k 近邻规则是模式识别领域广泛使用的一种简单有效的方法 它的效果的好坏只依赖于确定最近邻的距离度量 基于欧式距离度量学习函数的大间隔最近邻居分类算法能够很好的改善k displaystyle k 近邻算法分类效果 1 目录 1 定义 1 1 目标邻居的定义 1 2 入侵样本的定义 2 算法 3 参考文献 4 外部链接定义 编辑大间隔最近邻居算法的主要想法就是通过学习一种距离度量使得在一个新的转换空间中 对于一个输入x i displaystyle x i nbsp 的k displaystyle k nbsp 个近邻都属于同一类别 而不同类别的样本与x i displaystyle x i nbsp 保持一定大的距离 如果该想法能够实现则留一 LOO 分类错误率将会最小化 该算法的最主要的任务就是求得满足条件的线性空间转换矩阵M displaystyle M nbsp 定义有类别标签的训练数据集为 D x 1 y 1 x n y n R d C displaystyle D vec x 1 y 1 dots vec x n y n subset R d times C nbsp 其中类别标签集为 C 1 c displaystyle C 1 dots c nbsp 我们的目标是学习一种用来估计如下平方距离的线性变换M displaystyle M nbsp d x i x j x i x j M x i x j displaystyle d vec x i vec x j vec x i vec x j top mathbf M vec x i vec x j nbsp 其中M displaystyle M nbsp 是半正定矩阵 欧氏距离是该距离度量的特例 M displaystyle M nbsp 为单位矩阵的形式 该度量算法也被称作是马氏距离度量 Mahalanobis Metric 图1显示了 该算法的学习过程 nbsp Figure 1 Schematic illustration of LMNN 目标邻居的定义 编辑 对于每一个输入样本x i displaystyle x i nbsp 除了要知道其类别标签y i displaystyle y i nbsp 外 还需要确定其k displaystyle k nbsp 个目标邻居 即k displaystyle k nbsp 个同类别的输入 并且希望通过上式求出的距离最小 当缺乏先验知识的话 属于同类别的目标邻居可以由欧氏距离确定 则属于同类别的k displaystyle k nbsp 个的输入即为目标邻居 入侵样本的定义 编辑 对于任何一个输入样本x i displaystyle x i nbsp 其入侵样本是指与其最近邻的k displaystyle k nbsp 个样本中与其不同类的样本 该算法在对训练样本学习过程中应尽可能的使入侵样本的数目达到最小化 算法 编辑大间隔最近邻居算法的转换矩阵M displaystyle M nbsp 可以通过半定规划得到优化 该算法的目标是 对于每一个输入样本 其k displaystyle k nbsp 个目标邻居应尽可能的接近 而那些入侵样本应尽可能的远离该输入样本 即与其保持一定大的距离间隔 图1显示了该算法的学习过程 通过学习使得输入向量x i displaystyle x i nbsp 被其目标近邻包围 对于一个测试样本 我们取k displaystyle k nbsp 为3的最近邻规则 第一个优化的目标是实现输入样本x i displaystyle x i nbsp 与其目标近邻的平均距离的最小化 i j N i d x i x j displaystyle sum i j in N i d vec x i vec x j nbsp 第二个优化的目标是使输入样本x i displaystyle x i nbsp 到其目标邻居的距离与其到入侵近邻的距离至少保持1个单位的间隔 该约束可以表示为 i j N i l y l y i d x i x j 1 d x i x l displaystyle forall i j in N i l y l neq y i d vec x i vec x j 1 leq d vec x i vec x l nbsp 因此 最终的优化问题可以表示为 min M i j N i d x i x j i j l 3 i j l displaystyle min mathbf M sum i j in N i d vec x i vec x j sum i j l xi ijl nbsp i j N i l y l y i displaystyle forall i j in N i l y l neq y i nbsp d x i x j 1 d x i x l 3 i j l displaystyle d vec x i vec x j 1 leq d vec x i vec x l xi ijl nbsp 3 i j l 0 displaystyle xi ijl geq 0 nbsp M 0 displaystyle mathbf M succeq 0 nbsp 其中M displaystyle M nbsp 为半定矩阵 参考文献 编辑 Weinberger K Q Blitzer J C Saul L K Distance Metric Learning for Large Margin Nearest Neighbor Classification PDF Advances in Neural Information Processing Systems 18 NIPS 2006 1473 1480 2012 05 19 原始内容 PDF 存档于2011 01 15 引文使用过时参数coauthors 帮助 外部链接 编辑Matlab Implementation ICML 2010 Tutorial on Metric Learning 取自 https zh wikipedia org w index php title 大间隔最近邻居 amp oldid 69867674, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。