HillTop算法是什么

本文由 金楠 于 2016-12-5 17:30 发布在  SEO网站优化    阅读:4583      

  HillTop算法由康柏系统研究中心的Krishna Bharat(后加入Google和多伦多大学的George A.Mihaila2001年提出并申请了专利,后授权Google使用200312Google算法更新,成为Google核心排名算法之一

  HillTop是一种相关性链接分析算法,克服了PageRank算法的关性缺点,使网页排名的准确性更高。例如两个“医疗”主题网站,分别获得10个“游戏”主题网站和10个“医疗卫生”主题网站的链接,那么获得“医疗卫生”网站链接的“医疗”网站的排名更好。HilTop算法称这种对主题有影响的文档为专家文件,从这些专家文件页面到目标网页的链接,是决定被链接网页“权重得分”的主要部分。

  HillTop算法吸收了PageRank算法、HITS算法相关性算法的一些特点:(1网页权重值传过程中,HillTopPageRank算法基本思想,即通过导入链接的数量和质量来确定网页的权重值;(2HillTop是与用户查询请求相关的链接分析算法,吸收了HITS算法中,根据用户查询获得高质量相关网页子集的思想,即主题相关网页之间的链接于权重计算的贡献比主题不相关的链接价值要更高

  如图2.33 HillTop算法的流程,这里省略了排序器等工作部分,只看HillTop算法的流程,与其他算法不同的是,它包括以下两方面的工作:

  (1建立专家文件索引首先从海量的互联网网页中通过一定规则筛选出主要关键词的专家文件子集合,并单独为这页面集合建立专家索引存于索引库中

  (2)用户检索,HillTop在接收到用户发出的检索请求时首先根据用户检索的主题,从专家文件子集的索引找出部分相关性最强的专家文件,如文件AB判断每个相关专家文件的相关性得分。然后根据专家文件其他相关文件的链接关系来对目标文件进行排序。排序的链接关系计算和PageRank算法的链接数量和质量原则相似这里的专家文件得分通过链接关系传递给目标文件以传递的分数作为目标文件,与用户检索关键词相关性的排序得分最后HillTop算法整合相关专家页面和得分较高的目标文件,作为搜索结果返回给用户。也就是下例中,相关专家文件AB同时链接目标文件2,接收到两个专家文件的得分,因此排名也领先于目标文件1

HillTop算法的流程

2.33 HillTop算法的流程

 

  HillTop算法和其他链接分析方法一样,也有优缺点:

  它的主要优点是利用相关专家页面的链接分析,使搜索结果更准确权威,相关性也更高,排名标准更为统一和具体。

  它的缺点主要是难以获得广泛主题的专家文件,并且专家文件的质量不好保证;HillTop算法的数据处理量非常大,这对服务器也是一个考验;另外新站点网页和新关键词在HillTop算法中都难以获得排名。

  不管HillTop算法有多少的缺点,SEOer需要明白一个事实,搜索引擎对于相关网站的外链会给予更高的评分,在建设外链时,相关主题的外链尤其是主要竞争对手的外链,对排名的提升作用更大,当然这些外链的获得难度也更高。

 

  本文节选自金楠所著《seo搜索引擎实战详解》一书,更多内容可关注金楠博客或者选择购买本书。

  相关阅读:点击看看吧!

  seo网站优化频道:http://www.jonanseo.com/sort/1

  软文营销频道:http://www.jonanseo.com/sort/2

  互联网产品频道:http://www.jonanseo.com/sort/4

  互联网思维频道:http://www.jonanseo.com/sort/5

  本文为金楠博客原创文章,转摘请注明出处。

 


发表评论:

请勾选我再发表评论!

金楠互联网之路  |  手机版  |  RSS  |  金楠简介  |  联系金楠  |  免费培训QQ群

All Rights Reserved. Powered by 金楠互联网之路  |  网站地图  |   蜀ICP备2024052279号