HillTop算法是什么
本文由 金楠 于 2016-12-5 17:30 发布在 SEO网站优化 阅读:4583
HillTop算法是由康柏系统研究中心的Krishna Bharat(后加入Google)和多伦多大学的George A.Mihaila在2001年提出并申请了专利,后来授权给Google使用,2003年12月Google算法更新,成为Google核心排名算法之一。
HillTop是一种相关性链接分析算法,克服了PageRank算法的无相关性缺点,使网页排名的准确性更高。例如两个“医疗”主题网站,分别获得10个“游戏”主题网站和10个“医疗卫生”主题网站的链接,那么获得“医疗卫生”网站链接的“医疗”网站的排名更好。HilTop算法称这种对主题有影响的文档为专家文件,从这些专家文件页面到目标网页的链接,是决定被链接网页“权重得分”的主要部分。
HillTop算法吸收了PageRank算法、HITS算法、相关性算法的一些特点:(1)在网页权重值传递过程中,HillTop采用了PageRank算法的基本思想,即通过导入链接的数量和质量来确定网页的权重值;(2)HillTop是与用户查询请求相关的链接分析算法,吸收了HITS算法中,根据用户查询获得高质量相关网页子集的思想,即主题相关网页之间的链接对于权重计算的贡献,比主题不相关的链接价值要更高。
如图2.33 HillTop算法的流程,这里省略了排序器等工作部分,只看HillTop算法的流程,与其他算法不同的是,它包括以下两方面的工作:
(1)建立专家文件索引,首先从海量的互联网网页中通过一定规则,筛选出主要关键词的专家文件子集合,并单独为这些页面集合建立专家索引存于索引库中。
(2)用户检索,HillTop在接收到用户发出的检索请求时,首先根据用户检索的主题,从专家文件子集的索引中,找出部分相关性最强的专家文件,如文件A和B,并判断每个相关专家文件的相关性得分。然后根据专家文件和其他相关文件的链接关系,来对目标文件进行排序。排序的链接关系计算和PageRank算法的链接数量和质量原则相似,这里的专家文件得分通过链接关系传递给目标文件,以传递的分数作为目标文件,与用户检索关键词相关性的排序得分,最后HillTop算法整合相关专家页面和得分较高的目标文件,作为搜索结果返回给用户。也就是下例中,相关专家文件A和B同时链接目标文件2,接收到两个专家文件的得分,因此排名也领先于目标文件1。
图2.33 HillTop算法的流程
HillTop算法和其他链接分析方法一样,也有优缺点:
它的主要优点是利用相关专家页面的链接分析,使搜索结果更准确权威,相关性也更高,排名标准更为统一和具体。
它的缺点主要是难以获得广泛主题的专家文件,并且专家文件的质量不好保证;HillTop算法的数据处理量非常大,这对服务器也是一个考验;另外新站点网页和新关键词在HillTop算法中都难以获得排名。
不管HillTop算法有多少的缺点,SEOer需要明白一个事实,搜索引擎对于相关网站的外链会给予更高的评分,在建设外链时,相关主题的外链尤其是主要竞争对手的外链,对排名的提升作用更大,当然这些外链的获得难度也更高。
本文节选自金楠所著《seo搜索引擎实战详解》一书,更多内容可关注金楠博客或者选择购买本书。
相关阅读:点击看看吧!
seo网站优化频道:http://www.jonanseo.com/sort/1
软文营销频道:http://www.jonanseo.com/sort/2
互联网产品频道:http://www.jonanseo.com/sort/4
互联网思维频道:http://www.jonanseo.com/sort/5
本文为金楠博客原创文章,转摘请注明出处。
发表评论: