欢迎关注大数据技术架构与案例微信公众号:过往记忆大数据
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
过往记忆大数据

社会关系网之中心性分析法

  经常研究社会关系网的同学应该对社会关系网中的分析法比较熟悉,最近在写毕业设计用到了这方面的知识,所以在这做个总结。社会关系网是一门研究社会中社会实体(称为参与者)以及他们之间的活动与关系的学问。这种关系和活动可以用网络或者图来进行表示,其中,每一个顶点用来表示一个参与者,而一条边的链接用来表示两个参与者之间的关系。利用网络图我们可以研究该网络的结构特性,以及每一个社会参与者的职责、位置、威望等属性。

  所谓重要的或者卓越的参与者,就是那些广泛与其他参与者连接或者发生关系的参与者。一般认为,在一个机构中,与其他同事有广泛的交流或者联系的人,其重要性程度要高于那些与其他同事联系比较少的人。中心参与者就是那些牵涉到许多连接中的参与者。在社会网络关系中,每个结点代表一个参与者,每个链接代表线段两边的两个参与者之间是有关系的。

  实际情况中比较常用的中心性分析法主要有三种:度中心性(Degree Centrality)、接近中心性(Closeness Centrality)以及中介中心性(Betweenness Centrality)。下面讲讲这三种中心性分析法的概念。

  度中心性:中心参与者是拥有与其他参与者的链接或者链接数目最多,最活跃的参与者。假设网络中的参与者的总数为n。由于网络存在无向和有向的,所以,我们需要区别这两种点的中心度。

  1. 无向图:在无向图中,参与者i的重要性就是参与者结点的度,经过归一化处理之后可以表示为:
    有向图点中心性

    有向图点中心性 过往记忆

    其中,do(i)表示结点i的出度,其他的含义和无向图中的一样。

  接近中心性:这种中心性的观察视角主要基于接近度或者距离。它的基本思想是如果一个参与者能很容易的与所有其他参与者进行互动,那么它就是中心的。即它到其他所以参与者的距离要足够短。于是,我们就可以使用最短距离来计算这个数值。假设参与者i和参与者j之间的最短距离记为d(i,j)(由最短路径上的链接数目度量)。同样我们分为有向图和无向图来进行讨论。

  1. 无向图:参与者i的接近中心性被定义为:
    社会关系网 接近中心性

    社会关系网 接近中心性

    这个公式得出的数值也是在0到1之间。注意,从定义我们可以知道,这个等式只有在相应图为连通图时才有用。

  2. 有向图:上述公式也可以用在有向图中,只不过距离计算时,需要考虑链接和边的方向。这里就不给出定义了。

  中介中心性:如果两个不相邻的参与者k和j想要与对方互动而参与者i处在它们的路径上,那么i可能对它们之间的互动拥有一定的控制力。中介性用来度量i对于其他结点的控制能力。即如果i处在非常多结点的交互路径上,那么i就是一个重要的参与者。同样分为有向图和无向图来讨论。

  1. 无向图:以pjk表示参与者j和k之间的最短路径的数目,参与者i的中介性定义为所有经过结点i的路径数目,我们用pjk(i)表示,其中,j!=i,k!=i。被所有参与者对之间不包含i的最短路径数总和归一化出来后得到的数值。可以表示为:
    社会关系网 中介中心性

    社会关系网 中介中心性

    注意,参与者k和参与者j之间可能有多条最短路径。有些经过i,有些是不经过i的,我们假设所有路径被使用的可能性是相等的。CB(i)的最小值为0,在所有最短路径都不经过i是被取得,最大值是(n-1)(n-2)/2,即不包含参与者i的其他所有参与者构成的参与者对数目。如果我们想保证上述值在0到1之间,我们可以用CB(i)的最大值(n-1)(n-2)/2对起进行归一化处理,也就是CB(i)除于(n-1)(n-2)/2得到,这里就不给出定义了。

  2. 有向图:可以利用相同的公式但是需要将它们乘以2,因为考虑这种情形下,从j到k的路径和从k到j的路径是不一样的,所以现在总共有(n-1)(n-2)个节点对。同样的道理,pjk现在也需要考虑两个方向,这里就不给出定义了。(完)
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【社会关系网之中心性分析法】(https://www.iteblog.com/archives/427.html)
喜欢 (17)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!