网站排名的HITS 算法
HITS(全称为Hypertext- Induced Topic Search)算法是由康奈尔大学的 Jon Kleinberg博士于1997年首先提出的,为IBM公司阿尔马登研究中心的名为“CLEVER”的研究项目中的一部分。
HITS计算页面重要性时更查询请求。对于一个查询请求,算法会先通过基于文本关键字的信息检索系统得到数量不多的与查询请求相关性高的页面,称之为根集。然后将指向根集中页面的网页(有数量上限)和所有被根集中页面指向的网页都收入该集合,扩充后的集合称为基础集。最后对基础中的网页进行重要性计算。
Kleinberg认为网页具备两种属性:权威性(authority)和中心性(hub)。权威性高的网页包含了用户需要的信息资源,而中心性高的页面中包含了很多指向高权威性网页的链接。两者是互相增强的关系,页面i的权威性A( i)由指向自己的网页的中心性来计算,页面i的中心性H(i)由自己指向的网页的权威性来计算,对于每个页面都要计算它的权威性得分和中心性得分。
网站排名的HITS算法
作者:admin 发布时间:2017.05.09 浏览:
0
赞一个
上一篇:网站的PageRank值排名 下一篇:网站的搜狗Sogou Rank网页指数