fbpx
维基百科

集聚系数

图论中,集聚系数(也称群聚系数集群系数)是用来描述一个中的顶点之间结集成团的程度的系数。具体来说,是一个点的邻接点之间相互连接的程度。例如生活社交网络中,你的朋友之间相互认识的程度[1]。有证据表明,在各类反映真实世界的网络结构,特别是社交网络结构中,各个结点之间倾向于形成密度相对较高的网群[2][3]。也就是说,相对于在两个节点之间随机连接而得到的网络,真实世界网络的集聚系数更高。

集聚系数分为整体与局部两种。整体集聚系数可以给出一个图中整体的集聚程度的评估,而局部集聚系数则可以测量图中每一个结点附近的集聚程度。

基础概念 编辑

集聚系数主要是描述图(或者称为网络)的特性。一个图 G 是由一些顶点 V 和顶点与顶点之间的一些连线(称为边)E 构成。两个相连的顶点也称为邻接点。比如在一群人中,将每个人用一个点表示,如果两人之间认识,就将对应的两点连起来。这样就构成了一个图。有的图是有方向的,比如在同样一群人中,如果一人甲欠另一人乙的钱,就连一条从 甲至乙的线,这样就构成了一个有向图

整体集聚系数 编辑

整体集聚系数的定义建立在闭三点组(邻近三点组)之上。假设图中有一部分点是两两相连的,那么可以找出很多个“三角形”,其对应的三点两两相连,称为闭三点组。除此以外还有开三点组,也就是之间连有两条边的三点(缺一条边的三角形)。这两种三点组构成了所有的连通三点组。整体集聚系数定义为一个图中所有闭三点组的数量与所有连通三点组(无论开还是闭)的总量之比(也有定义为这个值的三倍,使得在完全图中的整体集聚系数等于1)。最早尝试测量这个系数是在1949年罗伯特·邓肯·路斯和阿尔伯特·D·佩里合作的一篇论文中[4]

假设有图 ,其中 表示顶点的集合, 表示边的集合(  表示连接顶点    的边)。

每一个顶点连接的顶点有多有少,用 L(i) 表示与顶点   相连的边的集合:

 

L(i) 里的边的数量就是顶点   的度,记作   

如果用   表示整体集聚系数,用   表示图中闭三点组的个数,  表示其中开三点组的个数,那么:

 

使用   来表示的话,也可以写成:

 [5]

局部集聚系数 编辑

 
局部集聚系数:蓝点有三个邻接点(白点)。如果三个白点都相互连接(上图),那么蓝点的集聚系数是3÷3=1;如果只有两点之间相连(中图,只有一条边),那么集聚系数是 ;如果没有两点是相连的,那么集聚系数就是0。

对图中具体的某一个点,它的局部集聚系数   表示与它相连的点抱成完全子图)的程度。邓肯·J·瓦兹英语Duncan J. Watts斯蒂芬·斯特罗加茨在1998年发表的一篇论文中首次引入了这个概念,用以判别一个图是否是小世界网络[3]

图中的一个顶点   的局部集聚系数   等于所有与它相连的顶点之间所连的边的数量,除以这些顶点之间可以连出的最大边数[6]。一般来说,对于无向图,这个最大边数等于  ;对于有向图,由于每两个顶点之间可以连两条边(不同方向),最大边数等于  。这时候的   表示的是指向顶点   的边与从顶点   指出去的边的总数。同时,对于有向图,要注意边   与边   是不一样的。

用数学公式表达的话,无向图中一顶点   的局部集聚系数是:

 

因为边   和边   指的是同一条边。有向图中一顶点   的局部集聚系数是:

 

在无向图   中,如果设一个顶点   的相连闭三角数为 ,也就是   中所有的包括了   的闭三点组(三点中连有三条边)的数目;再设   的相连开三角数为  ,也就是   中所有的包括了   ,并且满足两条边都与   相连的开三点组(三点中恰好连有两条边)。这时,顶点   的局部集聚系数也可以表示为:

 

很容易证明两种表示方法是等价的。实际上,计算   时候的每一个闭三点组,除   外的另外两点都是   的邻接点,并且他们相连。计算   时候的每一个开三点组,除   外的另外两点也都是   的邻接点,并且他们不相连。所以:

 

可以看出,一个顶点   的局部集聚系数   总是在0与1之间。   越接近1,表示   的“邻居”们越是“抱成一团”,接近完全图。  越接近0,说明它的邻居们“老死不相往来”,整个结构接近树状

平均集聚系数 编辑

知道了一个图里的每一个顶点的局部集聚系数后,可以计算整个图的平均集聚系数。这个概念也是瓦兹和斯特罗加兹在1998年的论文中引入的[3],具体来说就是所有顶点的局部集聚系数的算术平均数

 

平均集聚系数与整体集聚系数都是衡量一个图在整体上的集聚程度。事实上,两者的区别在于:

 
 

一个图(或称为网络)被叫做小世界网络,如果它的平均集聚系数远大于一个在同样的顶点集合上构造的随机图的平均集聚系数,并且它的平均最短路径长度和这种随机图基本相同。

在更为广泛的加权网络[7]二部图[8]中,也可以引进类似于集聚系数的概念。

参见 编辑

参考来源 编辑

  1. ^ 王冰、修志龙、唐焕文. (PDF). 《中国生物工程杂志》. 2005 No.6, 25–3: 10–14 [2011-04-20]. (原始内容 (PDF)存档于2018-10-01). 
  2. ^ P. W. Holland and S. Leinhardt. Transitivity in structural models of small groups. Comparative Group Studies. 1971, 2: 107–124. 
  3. ^ 3.0 3.1 3.2 D. J. Watts and Steven Strogatz. Collective dynamics of 'small-world' networks (PDF). Nature. June 1998, 393 (6684): 440–442 [2011-04-20]. PMID 9623998. doi:10.1038/30918. (原始内容 (PDF)于2012-01-05). 
  4. ^ R. D. Luce and A. D. Perry. A method of matrix analysis of group structure. Psychometrika. 1949, 14 (1): 95–116. PMID 18152948. doi:10.1007/BF02289146. 
  5. ^ N. Eggemann and S.D. Noble. The clustering coefficient of a scale-free random graph (PDF). Discrete Applied Mathematics. 2009, 159 (10): 953–965 [2011-04-20]. doi:10.1016/j.dam.2011.02.003. (原始内容 (PDF)于2017-08-13).  已忽略未知参数|month=(建议使用|date=) (帮助)
  6. ^ 章忠志、荣莉莉、周涛. 一类无标度合作网络的演化模型 (PDF). 《系统工程理论与实践》. 2005年11月, 11: 55–60 [2011-04-20]. (原始内容 (PDF)于2018-09-29). 
  7. ^ A. Barrat and M. Barthelemy and R. Pastor-Satorras and A. Vespignani. The architecture of complex weighted networks. Proceedings of the National Academy of Sciences. 2004, 101 (11): 3747–3752. PMC 374315 . PMID 15007165. doi:10.1073/pnas.0400087101. 
  8. ^ M. Latapy and C. Magnien and N. Del Vecchio. Basic Notions for the Analysis of Large Two-mode Networks. Social Networks. 2008, 30 (1): 31–48. doi:10.1016/j.socnet.2007.04.006. 

集聚系数, 在图论中, 也称群聚系数, 集群系数, 是用来描述一个图中的顶点之间结集成团的程度的系数, 具体来说, 是一个点的邻接点之间相互连接的程度, 例如生活社交网络中, 你的朋友之间相互认识的程度, 有证据表明, 在各类反映真实世界的网络结构, 特别是社交网络结构中, 各个结点之间倾向于形成密度相对较高的网群, 也就是说, 相对于在两个节点之间随机连接而得到的网络, 真实世界网络的更高, 分为整体与局部两种, 整体可以给出一个图中整体的集聚程度的评估, 而局部则可以测量图中每一个结点附近的集聚程度, 目录, . 在图论中 集聚系数 也称群聚系数 集群系数 是用来描述一个图中的顶点之间结集成团的程度的系数 具体来说 是一个点的邻接点之间相互连接的程度 例如生活社交网络中 你的朋友之间相互认识的程度 1 有证据表明 在各类反映真实世界的网络结构 特别是社交网络结构中 各个结点之间倾向于形成密度相对较高的网群 2 3 也就是说 相对于在两个节点之间随机连接而得到的网络 真实世界网络的集聚系数更高 集聚系数分为整体与局部两种 整体集聚系数可以给出一个图中整体的集聚程度的评估 而局部集聚系数则可以测量图中每一个结点附近的集聚程度 目录 1 基础概念 2 整体集聚系数 3 局部集聚系数 4 平均集聚系数 5 参见 6 参考来源基础概念 编辑集聚系数主要是描述图 或者称为网络 的特性 一个图 G 是由一些顶点 V 和顶点与顶点之间的一些连线 称为边 E 构成 两个相连的顶点也称为邻接点 比如在一群人中 将每个人用一个点表示 如果两人之间认识 就将对应的两点连起来 这样就构成了一个图 有的图是有方向的 比如在同样一群人中 如果一人甲欠另一人乙的钱 就连一条从 甲至乙的线 这样就构成了一个有向图 整体集聚系数 编辑整体集聚系数的定义建立在闭三点组 邻近三点组 之上 假设图中有一部分点是两两相连的 那么可以找出很多个 三角形 其对应的三点两两相连 称为闭三点组 除此以外还有开三点组 也就是之间连有两条边的三点 缺一条边的三角形 这两种三点组构成了所有的连通三点组 整体集聚系数定义为一个图中所有闭三点组的数量与所有连通三点组 无论开还是闭 的总量之比 也有定义为这个值的三倍 使得在完全图中的整体集聚系数等于1 最早尝试测量这个系数是在1949年罗伯特 邓肯 路斯和阿尔伯特 D 佩里合作的一篇论文中 4 假设有图G V E displaystyle G V E nbsp 其中V v 1 v 2 v n displaystyle V left v 1 v 2 cdots v n right nbsp 表示顶点的集合 E e i j i j S 1 n 2 displaystyle E left e ij i j in S subset left 1 cdots n right 2 right nbsp 表示边的集合 e i j displaystyle e ij nbsp 表示连接顶点 v i displaystyle v i nbsp 和 v j displaystyle v j nbsp 的边 每一个顶点连接的顶点有多有少 用 L i 表示与顶点 v i displaystyle v i nbsp 相连的边的集合 L i v j e i j E e j i E displaystyle L i left v j e ij in E land e ji in E right nbsp L i 里的边的数量就是顶点 v i displaystyle v i nbsp 的度 记作 k i displaystyle k i nbsp k i L i displaystyle k i L i nbsp 如果用 C t o t a l G displaystyle C total G nbsp 表示整体集聚系数 用 G displaystyle G triangle nbsp 表示图中闭三点组的个数 G displaystyle G land nbsp 表示其中开三点组的个数 那么 C t o t a l G 3 G 3 G G displaystyle C total G frac 3 times G triangle 3 times G triangle G land nbsp 使用 k i displaystyle k i nbsp 来表示的话 也可以写成 C t o t a l G 3 G i 1 n k i 2 displaystyle C total G frac 3 times G triangle sum i 1 n binom k i 2 nbsp 5 局部集聚系数 编辑 nbsp 局部集聚系数 蓝点有三个邻接点 白点 如果三个白点都相互连接 上图 那么蓝点的集聚系数是3 3 1 如果只有两点之间相连 中图 只有一条边 那么集聚系数是1 3 displaystyle scriptstyle frac 1 3 nbsp 如果没有两点是相连的 那么集聚系数就是0 对图中具体的某一个点 它的局部集聚系数 C i displaystyle C i nbsp 表示与它相连的点抱成团 完全子图 的程度 邓肯 J 瓦兹 英语 Duncan J Watts 与斯蒂芬 斯特罗加茨在1998年发表的一篇论文中首次引入了这个概念 用以判别一个图是否是小世界网络 3 图中的一个顶点 v i displaystyle v i nbsp 的局部集聚系数 C i displaystyle C i nbsp 等于所有与它相连的顶点之间所连的边的数量 除以这些顶点之间可以连出的最大边数 6 一般来说 对于无向图 这个最大边数等于 k i k i 1 2 displaystyle scriptstyle frac k i k i 1 2 nbsp 对于有向图 由于每两个顶点之间可以连两条边 不同方向 最大边数等于 k i k i 1 displaystyle k i k i 1 nbsp 这时候的 k i displaystyle k i nbsp 表示的是指向顶点 v i displaystyle v i nbsp 的边与从顶点 v i displaystyle v i nbsp 指出去的边的总数 同时 对于有向图 要注意边 e i j displaystyle e ij nbsp 与边 e j i displaystyle e ji nbsp 是不一样的 用数学公式表达的话 无向图中一顶点 v i displaystyle v i nbsp 的局部集聚系数是 C i 2 e j k v j v k L i e j k E k i k i 1 displaystyle C i frac 2 Big Big e jk v j v k in L i e jk in E Big Big k i k i 1 nbsp 因为边 e i j displaystyle e ij nbsp 和边 e j i displaystyle e ji nbsp 指的是同一条边 有向图中一顶点 v i displaystyle v i nbsp 的局部集聚系数是 C i e j k v j v k L i e j k E k i k i 1 displaystyle C i frac Big Big e jk v j v k in L i e jk in E Big Big k i k i 1 nbsp 在无向图 G displaystyle G nbsp 中 如果设一个顶点 v i V displaystyle v i in V nbsp 的相连闭三角数为l G v i displaystyle lambda G v i nbsp 也就是 G displaystyle G nbsp 中所有的包括了 v i displaystyle v i nbsp 的闭三点组 三点中连有三条边 的数目 再设 v i displaystyle v i nbsp 的相连开三角数为 t G v i displaystyle tau G v i nbsp 也就是 G displaystyle G nbsp 中所有的包括了 v i displaystyle v i nbsp 并且满足两条边都与 v i displaystyle v i nbsp 相连的开三点组 三点中恰好连有两条边 这时 顶点 v i displaystyle v i nbsp 的局部集聚系数也可以表示为 C i l G v i t G v i l G v i displaystyle C i frac lambda G v i tau G v i lambda G v i nbsp 很容易证明两种表示方法是等价的 实际上 计算 l G v i displaystyle lambda G v i nbsp 时候的每一个闭三点组 除 v i displaystyle v i nbsp 外的另外两点都是 v i displaystyle v i nbsp 的邻接点 并且他们相连 计算 t G v i displaystyle tau G v i nbsp 时候的每一个开三点组 除 v i displaystyle v i nbsp 外的另外两点也都是 v i displaystyle v i nbsp 的邻接点 并且他们不相连 所以 t G v i l G v i C k i 2 1 2 k i k i 1 displaystyle tau G v i lambda G v i C k i 2 frac 1 2 k i k i 1 nbsp 可以看出 一个顶点 v i displaystyle v i nbsp 的局部集聚系数 C i displaystyle C i nbsp 总是在0与1之间 C i displaystyle C i nbsp 越接近1 表示 v i displaystyle v i nbsp 的 邻居 们越是 抱成一团 接近完全图 C i displaystyle C i nbsp 越接近0 说明它的邻居们 老死不相往来 整个结构接近树状 平均集聚系数 编辑知道了一个图里的每一个顶点的局部集聚系数后 可以计算整个图的平均集聚系数 这个概念也是瓦兹和斯特罗加兹在1998年的论文中引入的 3 具体来说就是所有顶点的局部集聚系数的算术平均数 C 1 n i 1 n C i displaystyle bar C frac 1 n sum i 1 n C i nbsp 平均集聚系数与整体集聚系数都是衡量一个图在整体上的集聚程度 事实上 两者的区别在于 C 1 n i 1 n C i 1 n i 1 n l G v i t G v i l G v i displaystyle bar C frac 1 n sum i 1 n C i frac 1 n sum i 1 n frac lambda G v i tau G v i lambda G v i nbsp 而C t o t a l G i 1 n l G v i i 1 n t G v i l G v i displaystyle C total G frac sum i 1 n lambda G v i sum i 1 n left tau G v i lambda G v i right nbsp 一个图 或称为网络 被叫做小世界网络 如果它的平均集聚系数远大于一个在同样的顶点集合上构造的随机图的平均集聚系数 并且它的平均最短路径长度和这种随机图基本相同 在更为广泛的加权网络 7 和二部图 8 中 也可以引进类似于集聚系数的概念 参见 编辑正则图 ER随机图参考来源 编辑 王冰 修志龙 唐焕文 基于复杂网络理论的代谢网络结构研究进展 PDF 中国生物工程杂志 2005 No 6 25 3 10 14 2011 04 20 原始内容 PDF 存档于2018 10 01 请检查 date 中的日期值 帮助 P W Holland and S Leinhardt Transitivity in structural models of small groups Comparative Group Studies 1971 2 107 124 3 0 3 1 3 2 D J Watts and Steven Strogatz Collective dynamics of small world networks PDF Nature June 1998 393 6684 440 442 2011 04 20 PMID 9623998 doi 10 1038 30918 原始内容存档 PDF 于2012 01 05 R D Luce and A D Perry A method of matrix analysis of group structure Psychometrika 1949 14 1 95 116 PMID 18152948 doi 10 1007 BF02289146 N Eggemann and S D Noble The clustering coefficient of a scale free random graph PDF Discrete Applied Mathematics 2009 159 10 953 965 2011 04 20 doi 10 1016 j dam 2011 02 003 原始内容存档 PDF 于2017 08 13 已忽略未知参数 month 建议使用 date 帮助 章忠志 荣莉莉 周涛 一类无标度合作网络的演化模型 PDF 系统工程理论与实践 2005年11月 11 55 60 2011 04 20 原始内容存档 PDF 于2018 09 29 A Barrat and M Barthelemy and R Pastor Satorras and A Vespignani The architecture of complex weighted networks Proceedings of the National Academy of Sciences 2004 101 11 3747 3752 PMC 374315 nbsp PMID 15007165 doi 10 1073 pnas 0400087101 M Latapy and C Magnien and N Del Vecchio Basic Notions for the Analysis of Large Two mode Networks Social Networks 2008 30 1 31 48 doi 10 1016 j socnet 2007 04 006 取自 https zh wikipedia org w index php title 集聚系数 amp oldid 72593750, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。