雅卡尔指数, 英語, jaccard, index, 又称为交并比, intersection, over, union, 雅卡尔相似系数, jaccard, similarity, coefficient, 是用于比较样本集的相似性与多样性的统计量, 雅卡尔系数能够量度有限样本集合的相似度, 其定义为两个集合交集大小与并集大小之间的比例, 集合a与b的交集与聯集, displaystyle, over, over, 如果a与b完全重合, 则定义j, 于是有, displaystyle, 雅卡尔距离, jaccar. 雅卡尔指数 英語 Jaccard index 又称为交并比 Intersection over Union 雅卡尔相似系数 Jaccard similarity coefficient 是用于比较样本集的相似性与多样性的统计量 雅卡尔系数能够量度有限样本集合的相似度 其定义为两个集合交集大小与并集大小之间的比例 集合A与B的交集与聯集 J A B A B A B A B A B A B displaystyle J A B A cap B over A cup B A cap B over A B A cap B 如果A与B完全重合 则定义J A B 1 于是有 0 J A B 1 displaystyle 0 leq J A B leq 1 雅卡尔距离 Jaccard distance 则用于量度样本集之间的不相似度 其定义为1减去雅卡尔系数 即 d J A B 1 J A B A B A B A B displaystyle d J A B 1 J A B A cup B A cap B over A cup B 此外 亦有人将雅卡尔距离定义两集合对称差A B A B A B displaystyle A triangle B A cup B A cap B 的大小与并集大小之间的比例 雅卡尔距离是所有有限样本集合间的度量 1 2 3 参见 编辑简单匹配系数 汉明距离 Dice系数参考文献 编辑 Sven Kosub A note on the triangle inequality for the Jaccard distance arXiv 1612 02696 页面存档备份 存于互联网档案馆 Lipkus Alan H A proof of the triangle inequality for the Tanimoto distance J Math Chem 1999 26 1 3 263 265 Levandowsky Michael Winter David Distance between sets Nature 1971 234 5 34 35 doi 10 1038 234034a0 取自 https zh wikipedia org w index php title 雅卡尔指数 amp oldid 72952906, 维基百科,wiki,书籍,书籍,图书馆,