欢迎关注Hadoop、Spark、Flink、Hive、Hbase、Flume等大数据资料分享微信公共账号:iteblog_hadoop
  1. 文章总数:978
  2. 浏览总数:11,952,980
  3. 评论:3936
  4. 分类目录:106 个
  5. 注册用户数:6116
  6. 最后更新:2018年12月15日
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
iteblog_hadoop
大数据技术博客公众号bigdata_ai
大数据猿:
bigdata_ai

社会关系网之权威计算分析法

在社会关系网中,入度越多的实体权威性越大;反之则越小。从上面的定义可以看出,权威性的衡量必须在有向图中进行,无向图是没有权威性的概念,不过无向图中可以用中心度去衡量实体的重要性。目前,比较常见的用于计算结点权威性的模型主要有三种:度权威(Degree Prestige)、邻近权威(Proximity Prestige)以及等级权威(Rank Prestige),下面分别简略地介绍一下这些权威的概念。

度权威

度权威的计算比较简单,它是直接计算一个结点的入度的总和,计算实体i的度权威公式如下[45,46]:
$$P(i) ={d_I(i)\over n -1} $$

社会关系网之权威分析法

社会关系网之权威分析法


其中,dI(i)表示实体i的入度的总和,n表示实体i所在的社会关系网中总的实体个数,但是这个入度的总和不包括自己对自己的入度,所以每个结点最大的入度之和为n-1。式4-1中除于n-1的目地是为了做归一化处理,使得每个结点的权威值都在0和1范围之间(可以取到边界值)。当其他所有的实体都指向实体i的时候,实体i的权威将达到最大值,这也说明了其他所有的实体对实体i的认可。当其他所有的实体都没指向实体i,这时候实体i的权威达到最小值,也就是实体i在这个社会关系网中的权威比较低。

  (2)邻近权威[45,46,47]

  度权威只考虑到与实体i直接相邻结点的入度,而邻近权威不仅对相邻的实体进行考虑,而且考虑到与实体i间接相连的实体j。换句话说,也就是实体j可以经过一条路径到达实体i,这就是与实体i间接相连的。把所有能够到达实体i结点的集合记为Ii,定义每一条边的长度都是1,记实体j到达实体i的最短路径长度记为d(j,i)。那么实体i的邻近权威计算如下:

社会关系网之权威分析法

社会关系网之权威分析法


其中表示集合Ii中所有能够到达实体i最短距离的总和,|Ii|表示所有能够到达实体i的其他实体个数总和。同样,对式4-2进行归一化处理,则计算公式如下:
社会关系网之权威分析法

社会关系网之权威分析法


式4-3计算出来的P(i)′值域范围为0到1之间。其中|Ii|/(n-1)表示的是能够到达实体i的其他实体占总实体个数的比例。

  (3)等级权威[45,46]

  度权威只考虑到实体的入度,而邻近权威不仅考虑到实体的入度,还考虑到实体之间可达的最短距离,它们都有个特点,那就是都忽略了实体“投票权”(也就是链入)的重要性程度,不同权威的实体“投票”的权值是不一样的,而这个因素在权威性评估上很重要;比如在公司部门经理选举时,公司老板对某个实体的投票很明显要比一个普通员工对他投票的重要性要高的多,而对于这个实体来说,那个普通员工和老板的投票都是对自己的入度。那么等级权威的概念可以定义为:如果很多有权威的实体j对实体i有联系(也就是实体j对实体i有入度),那么实体i的权威很明显也是比较高的,由此得到实体i的权威计算如下:
4-4
其中,P(j)是实体j的权威度,E表示在社会关系网中所有和实体i有连结的实体集合,这个集合中的实体都指向实体i,构成了一个有向图。从式4-4可以看出,实体i的权威等于所有和它有入度关系的实体权威的累积,从定义可以看出,实体i的权威是受别的实体权威的影响。

  假设社会关系网中一共有n个实体,每个实体的权威记为P(i),社会关系网中所有实体的权威用矩阵P来表示;那么,矩阵P的定义如下:

P = [P(1)  P(2)  P(3) … P(n)]

式4-5

  社会关系网中每个实体之间的联系用邻接矩阵A表示,矩阵A中的值只可能是1或者0,当Ai,j = 1时,说明实体i指向实体j,当Ai,j = 0时,表示实体i没有指向到实体j。那么,社会关系网中每个实体的权威计算公式可以表示如下:

P = ( AT PT ) T

式4-6

其中,矩阵AT以及矩阵PT分别表示矩阵A和矩阵P的转置矩阵。

  等级权威在HITS算法和Google的PageRank算法中有很重要的应用,而且是那两个算法的核心,HITS算法和PageRank算法都是用来量化Web网页的权威度的。

本博客文章除特别声明,全部都是原创!
转载本文请加上:转载自过往记忆(https://www.iteblog.com/)
本文链接: 【社会关系网之权威计算分析法】(https://www.iteblog.com/archives/462.html)
喜欢 (3)
分享 (0)
发表我的评论
取消评论

表情
本博客评论系统带有自动识别垃圾评论功能,请写一些有意义的评论,谢谢!
(1)个小伙伴在吐槽
  1. I wanetd to spend a minute to thank you for this.
    Vanda2013-08-02 19:57 回复