| 主页 | 频道首页 | 本站地图 | 论坛留言 | 合作联系 | 本站消息 | |
科技动态 技术发展 文化研究 生物生态 人的研究 生命起源 基因工程 科学普及 科学探索 专题其他

Google TrustRank and Hilltop

2009-10-28
Google PageRank不是决定页面相关性的唯一因素。这里讨论两个众所周知的算法,即Hilltop算法及TrustRank(信任级别)。我们还收集了2个英文的Google TrustRank and Google Hilltop Algorithms 文章。供大家研究参考,方便大家。.Google TrustRank and Google Hilltop Algorithms,Google Trust Rank,Google Hilltop,Google信任指数,Google TrustRank,Trust Rank 算法,Hilltop 算法

Google TrustRank与Hilltop算法

时间:2009-06-30 作者:吴泽欣
PageRank不是决定页面相关性的唯一因素。在这篇文章里,我们讨论两个众所周知的算法,即Hilltop算法及TrustRank(信任级别)。

(1)Google TrustRank

我们采用半自动的方法从垃圾文件中筛选出质量较高的文件。首先,我们依靠一个专家去评估出一系列的”种子”页面。只要我们手工去识别这些受到好评的”种子”页面后,利用链接结构,我们就可以去寻找其他质量可能不错的页面。

   总结一下TrustRank的工作原理:我们先人工去识别一个高质量的页面(或称其为”种子”页面),那么在”种子”页面上存在链接指向的页面也有可能是高质量的页面。得到”种子”页面链接的页面,其TrustRank就越高,与”种子”页面链接深度越大的页面,其TrustRank自然就会慢慢降低(关于链接深度,请查看《SEO教程:搜索引擎优化入门与提高》中的“链接策略”一章)。

   一旦”种子”页面确定下来,那么就很容易从高质量页面中筛选中垃圾页面。基于TrustRank的逻辑大概是这样的:

1.  高质量页面一般都不链接至垃圾页面;

2.  TrustRank值会随着页面的过渡而逐渐降低,即某一页面与”种子”页面的链接深度越大,那么TrustRank值就会越低;

3.  最权威的网页就是”种子”页面本身。

例如:常见的”种子”页面包括DMOZ,Yahoo目录等。有人曾把TrustRank比喻为高质量页面的许可证。

 (2)       关于“Google TrustRank与Hilltop 算法”的一些有趣的观点:

 1.  链接权重继承因素;

2.  人工评估认为权威的页面将获得更高的权重。

 TrustRank是由Google后来的员工提出来的,低质量的分类目录对于提高页面的排名依然有好处,但正如SEO专家们已经呼吁多年的,低质量的分类目录的影响力正在慢慢消失。为了保持排名的稳定,我们必须指出如何去得到”种子”(权威)页面的反向链接。

Aaron Wall 在很久前就提出:“我们最好把互联网看到是一个巨大的社会网络”。这种观点到目前还被认为是正确的。链接体现出了人们之间的关键字,但是最好的链接是不能购买的- 正如我们在现实中是购买不了友谊的。

我们在进行搜索引擎优化时,如何去利用TrustRank呢?

如果你所处的是一个具有竞争的行业,那么Google极有可能利用TrustRank去决定”种子”页面以及过滤掉商业垃圾页面。这个关键就在于我们如何去识别”种子”页面(”种子”网站),然后从他们上面得到反向链接。

   在评估潜在链接伙伴时,我们最重要的是选择“种子”页面或者与种子页面存在链接关系的页面。怎样去识别这些页面呢?主要有几种方法,例如:这些页面上的信息对于用户来说是否有价值;权重高不高;域名开通及被收录的时间有多长。

   最后一点非常重要,新的商业网站不大可能会成为“种子”网站,因为旧域名所指向的网站通常是其行业的创始者,他们通常为行业带来巨大的改变,这些网站中往往会存在一些种子网站或者种子页面。

   如果你认为某个页面具有种子的潜力,那么你就可以跟他们提出交换链接的要求了。尽管这可能会花费你的时间或者金钱,但至少你可以得到一个高质量的链接。

Google HillTop算法分析

苏2009-9-22
        HillTop算法,作为现在Google现在最核心的排名算法之一,网上不乏大量介绍她的文献。本文侧重于原始算法的分析,不考虑过多复杂因素,让您更容易理解算法本质。

        HillTop算法集PageRank,HITs、相关性算法大成于一身,由康柏系统研究中心的Krishna Bharat和多伦多大学的George A.Mihaila在2001年提出并申请了专利,后授权于Google,2003年12月Google算法更新,其成为Google核心排名算法之一。

        HillTop是一种查询相关性链接分析算法,克服了的PageRank的查询无关性的缺点。简单的说HillTop算法是针对热门查询关键词来对搜索结果重新排序的一种算法。之所以针对热门关键词,这是因为HillTop算法运行效率较低的原因。

HillTop算法主要分为两个过程:

         一、专家页面的寻找和评分;搜索引擎根据用户查询日志发现热门关键词后,开始针对这些热门关键词寻找专家页面,成为专家页的2个必要因素,1)必须拥有足够多而且不存在隶属关系的出链,2)至少存在一个短语包含该热门关键词的所有术语。确定专家页以后,在该页面上找出所有全部包含热门关键词中术语、或者差1到2两个术语的短语,将这些短语分为三个等级,分别为全部包含,差1个和差2个术语,分别对这个三等级计算等级分,等级是分对各个等级中所有短语得分的和,而短语得分取决于这个短语在页面中位置,分数从高到低依次标题、头部和锚文本等等,然后的综合计算这个三个等级得分就得到专家分。以下举个简单的以“汽车消费”这个热门关键词为例,“中国汽车消费网”的首页和友情链接页就是这个关键词的专家页面,因为他具有足够多而且不隶属315che.com主机域名和同C类ip的出链,同时标题中的“中国汽车消费网”也包含“汽车”和“消费”这两个术语。接下来评分,先算第一等级(包含所有术语的短语)的得分,短语“中国汽车消费网”在标题中得到16分(假设),以及在锚文本中“中国汽车消费理财倾向大调查”得了1分,那么第一等级得分为17分,再算第二等级(差一个术语),第三等级(差两个术语)。这样再算三个等级得分的加权和,就是专家分。

         二、 对目标页评分;一个专家页对目标页的评分等于专家本身分值×专家页可区分的短语数量。取前N个指向目标页的专家页,对于多个同一隶属的专家页指向该目标页,取分值最高的专家页,然后这些专家页对目标网页的评分的和就得到,这个页面对应这个热门关键词的得分,有人称之为行业得分。

        我们可以看到HillTop算法通过不同等级的评分确保了评价结果对关键词的相关性,通过不同位置的评分确保了主题(行业)的相关性,通过可区分短语数防止了关键词的堆砌。

        总结:HillTop算法存在一种博弈的思想,在链接方面同行业的网站既需要竞争更需要合作,只有被同行“认可”的网站对热门关键关键词的查询才会被排在前面。HillTop基本毁灭了小网站对热门关键词的奢望,除非你对热门关键词有超强的预期能力,但是这种流量只会持续很短的时间。当然HillTop只是排名的一个重要因素,并不是全部。

Google HILLtop算法的更新

时间:2008-01-29
基于Atul Gupta 的关于Hilltop算法的文章,我做了一些研究总结出这篇文章。Atul Gupta是SEO Rank公司的CEO,正如 他在文章上所说的。Hilltop算法在十一月16号的更新(号称佛罗里达更新)中起到了不可轻视的作用。
 
     在我的有关google”佛罗里达更新的影响”的丛书里。在我较前的一篇文章里,我讨论了过度优化惩罚在一些网站上的体现,这些网站多是对某个关键字进行 过度的优化。 经过对hilltop算法的阅读与研究,我发现这个并不是一个新的算法,早在2001年已经出现了。

    正如你所预料 的,与以前的更新一样,google 对于依然保持一贯的沉默。所以,我的分析只是基于一些在google搜索引擎上的观察和测试。在深入研究这个算法是 怎样影响到你在google排名之前,让我解释一下Hilltop算法为何物以及他的工作原理是什么。这个对于你来说可能是一个搜索引擎全新的算法,我建议你去阅读有关google的page rank算法。

    在最基本的排列中,google 的 page rank算法决定了一个网站的重要程度及最后的排名。根据这个原则,一个拥有100个链接的网站比一个只有10个链接的网站排名要高。在你考虑的时候这个原则将变得更有意义。

    Hilltop 算法的定义:

     与page rank 对比,google的Hilltop 算法决定了指定网页与搜索框里的搜索查询语句或者关键字的适当与重要程度。在基本、简单的排 列中,取代了只依靠page rank的值去寻找那些权威的页面,当PR相同的两个描述同样主题的网站中的排名里,这个(hilltop)算法就显得非常 的重要了。

    通过这样的方法,计算来自描述相同主题的相关文档的链接对于搜索者的价值会更大(即相同主题网站之间的链接比不相关网 站的链接价值要更大)。在1999与2000年,当这个算法被Bharat与其他的google 人开发出来的时候,他们称这种相关的文档为“行家”(做 相同主题)文档,而从这些行家文档链接到目标文档决定了他们的“得分的权威性”。再次强调,这个意义不大。

    对于这个主题的一些更深入的信息,阅读由Bharat编写的一些文档,可以从多伦多计算机科学部得到。

    利用Hilltop算法去定义相关性的网站

    Google同样也利用这个算法去定义一个网站与另一个网站的相关性,实际上,Hilltop 算法在google 中作为一个检测杂交链接与相似链接的技术。另处一方面要注意的,google 的Hilltop算法是基于行家文档的计算,正如以上描述的。

    Hilltop 算法要求,如果有两个相关的网站链接到你的网站,那么你的网站在搜索中出现的机会会更大。如果Hilltop算法不查找到最少两个相关性的网站,那么搜索 返回的结果的机会绝对是0。Hilltop算法实际上是拒绝那些通过任意链接的方法来扰乱google的排名规则而得到较好排名的做法。

    但是,在2004年Hilltop算法又是什么呢?

    由于新的一年才刚开始,有些人可能会问:“这真的很cool,但是在“佛罗里达风暴”后,2004年将会有什么变化呢?”,这是一个很大的问题,而在过去的几个星期也有很多人发表了关于这方面主题的文章。

     今天跟过去,很多搜索引擎停止了那种只使用一种有价值的算法去决定排名的做法。如keyword标签,meta tag等。这只是一个开始,google 在第一步已经完全忽略meta 标签了。与meta相对照,一个网站的可视部分使用spam技术较在meta使用的要少,因为可视部分还要面对大部分的实 际的访问者。

  Google新算法背后的原因:

  在1998年google刚刚开始的时候,PR在决定适当程度与重要性方面起到了一个非常完美的作用。尽管如此,PR算法在设计上还是存在了一些脆弱性与限制性。google在很早以前也就知道了。

    PR值对于搜索述语或者指定的关键字起的作用不大,因此,高PR值只是给搜索述语或者指定的关键字提供参考。这就是google在Hilltop算法中尽量排除的东西。Google总是尽其所能去列出与搜索者相关的结果。

    回到Bharat,他在Hilltop 算法的专利,成为了google的代理。在与PR算法相比之下,Google意识到这个算法的进步会为他们的搜索排名带来非常重要的功能。Google的Hilltop算法现在已经能更好的与旧的算法(PR算法)联合起来工作。根据我的观察Hilltop算法比起它在2000年刚设计的时候已经有了很大的进步。显然这也是2003年11月16日“佛罗里达”更新中影响的一个最主要的算法。

    Hilltop 与google 33亿页面的庞大目录:

    在最初的时候,google的运作基本上是靠10000台奔腾级别的服务器(有些人称他们为廉价的个人电脑),它的数据库平均地分布在多台的个人电脑上,这就是google在成长时期要建立的硬件技术。

    回到Hilltop算法,如果我们对10000台低廉服务器是怎样拥有动态智能的处理能力进行观测,(能迅速地在数以万计的不同类型的网页中确定本地的一个行家文档)。很明显的就会发现,google 的Hilltop算法在起着巨大的作用。

    在搜索引擎方面,从我所看到的和知道的。自从11月16日,google现在的运行方式是一种批处理方式。成批地处理关键字、关键字短语与搜索语句。Google会在庞大的数据库里储存这些结果,以备搜索者在短期内继续用同样的关键字短语等进行搜索。
Google 是这样进行处理的:在数据库里会储存一些搜索频率比较高的关键字、关键字短语等。这些信息是通过“广告”程度进行收集的。(Adwords ppc)

  在我的观测中,google明显地为一个关键字的实际 给予一个随机的数值.回头看一下以前每个月的“google dance”,将会得出以下的结论:Hilltop算法会在那些被除数搜索频率较高的关键字中更新一次。因此,产生“google dance”影响。

    另外,在“佛罗里达”更新之前我已经注意到的了。那些突增的搜索关键字会得到较快的更新频率。如一则新闻,“禽流感”。每天的搜索次数,数以万计;Google就会对与这个关键有关的网站进行更新。

     总结:在结束这篇文章时,正如我以前的一些文章,如果你想你的网站排名较好的话,网站管理员和站主要跳出以前旧的思维。现在,链接流行度 (ink popularity)变得比以前更加重要。另外,尽你一切的努力把你的网站提交到更多的开放目录下。首先以DMOZ开始,避免那些免费的如自 助链接之类。这些有可能使到你的网站得到惩罚。经济允许的话,还可以向一些收费目录提高,如google的ppc广告程序或者overturn 等。你可 能会在这里得到真正的收益。注意:自1月15后(正如所料),yahoo已经把google排名完全放弃。
文章出处:DIY部落(http://www.diybl.com/course/4_webprogram/search/2008129/97901.html)

SEO两百个秘密:Google TrustRank及其影响因素分析

2008年11月28日发布:独孤天骄

什么是Google TrustRank

Goolge TrustRank翻译过来就是Google信任指数,是Google对于网站信赖程度的指数。搜索引擎信任值,是为了确保高质量的站点能够获得搜索引擎的第一时间关注,并保证原创的优先性,从而确保好的网站能获得更高的搜索表现。

Google自己最早关于TrustRank的论述:“垃圾页面经常使用各种各样的作弊方法来获取一个好的搜索引擎排名,虽然人工可以很容易识别这些垃圾,但问题是这么多的页面,靠人工是无法完成的,所以我们就提出了我们最新的半自动的一种技术方案。我们首先让我们的专家选择一些好的样板页面,然后分析他们的连接结构并以此结构来比较其他页面,进而发现那些没有作弊可能性较大的页面。我们讨论了好几种样板选择和如果发现优质页面的方案, 我们利用AltaVista在因特网上进行了实验,并评估了我们这项技术的效果,结果证明我们能够很好的通过网上一小部分优质的网站来辨别垃圾页面。当然这些优质的样板网站数量不得少于200个。”

独孤天骄的理解是,Google的TrustRank首先是对网站的“信任”,其次才是对网页的“信任”。就是说,只要你的站点获得较高的TrustRank值,那么你站内的网页也就获得或者很容易就可以获得较高的TrustRank值,从而获得较好的排名,这一点跟PR的单纯链接权重不相一致。在这个意义上,它甚至超过了我们平常所关注的关键词密度,PR值,链接广泛度,链接数量等因素。

“沙盒效应”也许就是Goolge TrustRank的一个延伸,当然这二者关系是很微妙的,高TrustRank值的站点容易逃出SandBox,但逃出SandBox的站点才有可能获得高TrustRank值。这个矛与盾的观点就涉及了到底鸡生蛋还是蛋生鸡的哲学问题了。

Google TrustRank出现的背景

由于Google搜索引擎在计算网页排名的时候,非常依赖连接,逐渐形成了Google PageRank,但是单纯依靠PR的办法已遭到了各种各样作弊行为的挑衅。Goolge TrustRank则采用半人工的方式,通过Google或其他一些检索机构的专家,先确定一批站点的TrustRank值,再通过机器的连接结构分析来确定互联网上其他站点的TrustRank值,然后以TrustRank值的高低来做为网页排名的一个重要依据。TrustRank是与PageRank相关的链接分析技术,用以将来自Spam的链接与优质内容带来的真正意义上的好评区别开来,其计算的基础是大部分优秀的文件很少链接至Spam。在处理上TrustRank分两个步骤,源目标的选定和评分的传递。一个超链接文件的TrustRank用来评价其是否具有真正的权威性。跟PR值原理类似,如果其他站点获得了来自高TrustRank值站点的连接也将获得更高的TrustRank值。作为PR的准替代品,Goolge TrustRank重要性不言而喻,甚至已经超过PR值的作用。

影响Google信任指数的一些因素

网站信任度有两方面的意义,一方面指浏览者对于站点的信任程度,另一方面指搜索引擎对于网站的信任值(TrustRank)。独孤天骄认为获得搜索引擎信任,提升搜索引擎信任值,有利于提升权重和搜索引擎排名,具体可能涉及到的参数但不限于:

1、域名的历史。要获得较高信任值,网站的历史肯定是个很重要的因素。包括网站域名的注册时间(域名续费的时间越长越好)和开通时间(即被Google检索到的时间),开通较长的站点更值得信任。

2、频繁的有规律的更新。更接近一个好站点的实际内容增加模式,持续不断的原创内容。这一点我们可以从几乎所有的新闻源,都是极高的TrustRank看出。

3、外部连接的质量和连接分布情况;内部链接没有无效链接,404错误等;保证网站良好的导航结构。
4、服务器的质量。包括独立的IP、网站能够持续稳定的可访问。
5、没有作弊行为,优化痕迹不要太明显。
6、尽量不要频繁的改版,会影响搜索引擎对网站的印象。
7、用户行为。搜索结果被点击情况和工具条搜集的点击量。
8、一些用户体验的优化,比如关于我们页面、联系方式、版权信息、隐私保护、网站ICP备案许可。对用户体验友好的网站一般也受搜索引擎的喜爱,因为搜索引擎搜索出来的东西本来就是给人看的,SEO不能抛弃内容。

怎么判断Google对站点的TrustRank

虽然我们可以通过站点文章被索引的时间和权重来判断等等因素来综合判断,但目前还没有确切的SEO方法可以操作。不过独孤天骄找到一个简单的办法,就是看Google对你站点的索引有没有形成SiteLink,如果有的话,则证明Google对你网站的TrustRank指数比较高,如果没有,则尚需努力。至于如何形成Sitelink,大家可以看这篇文章:http://www.dugutianjiao.com/post/seo-sitelinks-secret.html

但是,随着时间的推移,Trustrank引起的新问题开始渐渐凸显。搜索结果充斥着著名和权威站点的影子,即使这些页面内容可能是Spam。这就是为什么用一些权重高的站点发布同样的内容页,排名要明显高得多的原因。而一些好的个人站点或企业站点,尤其是新建的站点,即使内容非常好,在排名上也很难获得更多的优势,这个已经渐渐影响Google搜索结果的质量。

参考文献:
SEO两百个秘密:搜索引擎的“沙盒效应” :http://www.dugutianjiao.com/post/seo-sandbox-effect.html,独孤天骄。
什么是Google信任指数TrustRank? http://www.dunsh.org/2006/08/12/what-is-google-trustrank/,石头
SEO两百个秘密:Google TrustRank及其影响因素分析链接地址:http://www.dugutianjiao.com/post/seo-trustrank-secret.html

什么是Google信任指数TrustRank?

石头 发表在 08月 12, 2006
从2005年5月份我开始关注Goolge TrustRank(Google网页信任指数),一年的多实际观察和实践经验中证明:TrustRank是一个对网站排名有重大影响的参数,重要性超过PR值。SEO绝对不应该忽视TrustRank的存在。点石互动成员石头就GoogleTrust Rank进行一些简单的总结。本文主要回答什么是Google TrustRank。

一、Google信任指数TrustRank背景。

  由于搜索引擎在计算网页排名的时候,非常依赖连接,而且连接的质量越来越显得重要。这种情况,需要对连接的来源站点质量进行判断。更重要的是,以前依靠连接和相关性来决定排名的方式,已遭到了各种各样作弊行为的挑衅,Spam的横行,直接导致了Google必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的亲徕。这种情况下Sandbox和TrustRank被提了出来。意图确保好的站点能获得更高的搜索表现,并加强对站点的审核。Google自己关于TrustRank的最初论述也提到了这些。

二、Google自己最早关于TrustRank的论述:

    Web spam pages use various techniques to achieve higher-than-deserved rankings in a search engine's results. While human experts can identify spam, it is too expensive to manually evaluate a large number of pages. Instead, we propose techniques to semi-automatically separate reputable, good pages from spam. We first select a small set of seed pages to be evaluated by an expert. Once we manually identify the reputable seed pages, we use the link structure of the web to discover other pages that are likely to be good. In this paper we discuss possible ways to implement the seed selection and the discovery of good pages. We present results of experiments run on the World Wide Web indexed by AltaVista and evaluate the performance of our techniques. Our results show that we can effectively filter out spam from a significant fraction of the web, based on a good seed set of less than 200 sites.

  垃圾页面经常使用各种各样的作弊方法来获取一个好的搜索引擎排名.虽然人工可以很容易识别这些垃圾,但问题是这么多的页面,靠人工是无法完成的.所以我们就提出了我们最新的半自动的一种技术方案.我们首先让我们的专家选择一些好的样板页面,然后分析他们的连接结构并以此结构来比较其他页面,进而发现那些没有作弊可能性较大的页面.我们讨论了好几种样板选择和如果发现优质页面的方案. 我们利用AltaVista在因特网上进行了实验,并评估了我们这项技术的效果.结果证明我们能够很好的通过网上一小部分优质的网站来辨别垃圾页面,当然这些优质的样板网站数量不得少于200个.

三、什么是Google Trsustrank?

 Google诚信指数(TrustRank)是指网站对于Google而言值得信赖的程度。

  网站TrustRank的计算采用人工和机器连接分析相结合的方式。通过Google或其他一些检索机构的专家,可以先确定一批站点的TR值,在通过机器的连接结构分析来确定互联网上其他站点TrustRank值,然后以TR值的高低来做为网页排名的一个重要依据。跟PR值原理类似,如果其他站点获得了来自高Tr值站点的连接也将获得更高的TR值。Google TrustRank应该是以站点而不是页面为单位的。

四、 Google TrustRank的影响

  Google TrustRank的影响现在已经越来越明显,大量的SEO通过实践都证明了TrustRank是真实存在的。而google也早就注册了TrustRank的商标。

  Google TrustRank对于网站排名有种非常重要的影响:

  1。 站点内的页面在其他情况参数接近的情况下。高TR值的站点内页面将获得比其他站点页面更高的排名。

  2。 高TR值站点的页面收录速度加快。因为Google对它认为重要的站点会频繁访问。

  3。 获得足够的TR值的站点可以避免Sandbox。

  4。 如果一个站点的信任指数太低,google将可能会将其进行惩罚,包括进入sandbox等

  5。如果一个站点的信任指数太低,即使其他参数非常理想,在较热门关键词上,也很难获得好的排名表现。

 总之,石头认为,Google TrustRank对于排名的影响是非常直接和明显的,超过了平常提到的所谓关键词密度,PR值,连接广泛度,连接数量等因素。接下来的另一文章将探讨影响Google TR值的因素。以上文章仅供参考,只代表作者个人看法。请谨慎判断。作者: 石头 原载: 点石互动搜索引擎优化博客

Google TrustRank and Google Hilltop Algorithms

This guide explains the idea behind Google TrustRank and Google Hilltop Algorithms, and what factors might be considered when being calculated.

What is Google TrustRank (TR)?

Recently there has been discussion whether Google has developed some kind of 'TrustRank' which is used to determine search engine positions. If this does indeed exist, then it shows that Google is determined to only give high search engine positions to websites that it deems to be trustworthy, i.e. do not partake in any blackhat/spam techniques.

Although there is no official confirmation from Google that this actually exists, they did just register the Trade Mark for "TrustRank", and perhaps the introduction of the Sandbox is just an extension of the TrustRank implementation.

What Could Affect My Website's TrustRank?

Domain Age – New websites currently get filtered (the Sandbox), so it seems feasible that the older a website gets, the more trust is placed in it.

Length of Domain Registration - By registering a domain for a longer period may show you have a long-term vision for the website.

Regular Updates - By adding content to your site regularly you show that the site is being continually updated and cared for.

Backlinks - The whole concept of the World Wide Web is that websites interlink with each other, but there are 3 different groups of backlinks: -

Good Links: Good links are one-way links from websites that are in a similar theme to your own website and the links are inside a body of text.

'Not-So-Good Links': Not so good links might include reciprocal links, or backlinks from off-topic websites.

Bad Links: Bad links are from websites that operate Blackhat* optimization techniques, or from websites that are banned.

* Blackhat is a term used to describe webmasters who purposefully use underhanded tactics to trick the search engines in giving them good rankings.

Unique IP - Having a unique IP address might show you care enough for your website to have purchased a unique IP address, and you also ensure your IP is not shared with any 'bad nighbours'.

Sitemaps - Including a sitemap helps search engine spider your site. It also helps visitors find what they are looking for. It may also builds trust since you are considerate enough to help the viewer find what they are looking for. This isn’t about the ability to easily crawl, rather just offering the option to visitors shows you have their interests at heart. Note: Again, no proof, just an idea.

Reliable Uptime – Sites that have poor up-time lose trust.

Targeting KWs based on Traffic over Relevance – Every website is unique, and perhaps if you target the market that applies most to your website, rather than the one that will bring most traffic will increase your traffic ranking.

Spam - Using any kind of Blackhat technique could lose you trust, such as doorway pages, cloaking, duplicate content, pointing multiple domains to the same site, hidden text, keyword stuffing, comment spamming, pop-ups, and hidden links.

  Definitions
  Cloaking - displaying different content to the search engines to what 'regular' visitors see.

Duplicate content - copying content from other websites and publishing it on your website.

Doorway pages (AKA landing pages) - individual pages that are optimized for one specific keyword.

Keyword stuffing - Over-using your targetted keyword / keyphrase on a webpage. This tactic is usually employed in doorway pages.

Going Off-Topic – Adding content to your website that is not related to your site theme might be seen as a way of spamming, and as a result hurt your TrustRanking.

Bad Topics - Producing a website that is commonly associated with spam/blackhat might reduce your TrustRank. Sites such as gambling, alcohol, anything illegal, hate speech, pornography, or anything that may get filtered by Google's SafeSearch.

Too Many Terms in the Domain Name or URL – For example: www.these-are-all-of-my-keywords.com or www.domain.com/these-are-all-my-keywords.html. This hits more with keyword stuffed URLs.

Creating a Google Sitemap – People who create a Google sitemap are usually doing it for the purpose of search engine optimization. So can just creating one hurt your TrustRanking?

Meta – Can spamming the meta tags of a webpage damage your TrustRank?

Templates – Can Google recognize duplicate page layouts like they do with duplicate content?

Googlebar Tracking – By using the Google toolbar it is possible to track how popular a website is by counting the number of hits it gets, not necessarily just from the search engines.

SERP (search engine result page) Tracking - Click-through rates, or monitoring if visitors back out too soon. If they do then the site gets devalued for the term someone accessed it for.
http://www.weblinkseo.com/seo-guides/google-trustrank.jsp

Google`s Trust Rank and Hilltop Algorithms

By: Ivan Strouchliak  Search For More Articles!2008-12-30 
(2009-01-07)Google`s Trust Rank and Hilltop Algorithms(Page 1 of 4 )

PageRank is not the only algorithm Google uses to determine relevancy of pages. In this article we discuss two more publicly known algorithms, Hilltop and Trust Rank. Keep reading for some enlightenment on how the world's most popular search engine ranks web sites.
Both algorithms are quite old in the search engine arena (2005), but are still in use, as is the initial PageRank algorithm (though much tweaked over time). You need to be aware of both in order to understand search engines better.

In this article we discuss Hilltop and TrustRank, the reasons behind those algorithms, and how to optimize better with each algorithm in mind. We also link to the official white papers that cover each algorithm and useful resources so you can learn and become more effective in SEO game.

Google Trust Rank

Read the TrustRank white paper

…we propose techniques to semi-automatically separate reputable, good pages from spam. We first select a small set of seed pages to be evaluated by an expert. Once we manually identify the reputable seed pages, we use the link structure of the web to discover other pages that are likely to be good….


To summarize how Trust Rank works, a page is first identified by a human as being of very high quality, or a "seed page." Pages that the "seed page" links to are classified as high quality pages as well. Pages that are linked from seed pages get high Trust Rank, and the further a page is from a seed page in the web's link structure, the less Trust Rank is passed on to it.

Once seed pages are identified, it is easier to separate spam from quality pages. The logic behind Trust Rank is the following:

Quality pages do not link to spam (usually).

The trust score is reduced as it passes from page to page.

The most “powerful” trust score is from a seed page itself.

Examples of seed sites:

DMOZ, Search Engine Watch, Yahoo Directory, Microsoft.com
Ankhenaton, member of the Webmaster World makes an interesting point:

trustrank is the admittance that algorithms can't make reliable choices about quality in a commercial real world scenario. ;)

Google`s Trust Rank and Hilltop Algorithms - More interesting Trust Rank points(Page 2 of 4 )

Factors such as the pages you link to are given weight.

Human evaluated authority sites are given more linking power.

TrustRank is another algorithm in the long battle for quality by 19,000+ Google employees. Low quality PR directory listings can still help, but, as many SEO professionals have preached for years, they’re dying and have less value each month. In order to stay afloat, we must figure out how to get links from “seed pages” and authoritative sites, which in a sense is a networking skill.

Aaron Wall of seobook.com has said for a long time that it’s better to view the Internet as a vast social network, and this is even truer today. Links show relationships between people, and the best links cannot be bought -- just like relationships.

How Can We Use Trust Rank in Search Engine Optimization?

If you are in a competitive marketplace, it’s likely that Google uses Trust Rank to determine seed pages and filter out commercial spam. The trick SEOs face is to spot those “seed pages” or “seed sites” and get links from those pages.

As you analyze potential sites from which to get links, look for ones that might be “seed sites” or have “seed pages” within them. How editorial is the website? How authoritative is it? How useful is the information on it? How old is the domain?

The last question is important, because new commercial domains are not likely to be flagged as “seed sites,” while old domains that started commercial-free and developed some sort of business model have a greater chance of being a “seed sites” or having “seed pages” within.

If you think the site has “seed” potential, then it's worth the effort to get links from that website. It may cost you money or time, but at worst you will earn a quality link.

Since TrustRank is quite old in the search engine world, it’s likely it was adjusted and improved over the years, both on Google's vast test servers and on main indexes. There is no doubt that authority links are worth gold, and “seeds” are at the core of authority links.

Google`s Trust Rank and Hilltop Algorithms - Google Hilltop Algorithm(Page 3 of 4 )

Hilltop White Paper

…we propose a novel ranking scheme for broad queries that places the most authoritative pages on the query topic at the top of the ranking. Our algorithm operates on a special index of "expert documents." These are a subset of the pages on the WWW identified as directories of links to non-affiliated sources on specific topics. Results are ranked based on the match between the query and relevant descriptive text for hyperlinks on expert pages pointing to a given result page…

Hilltop is another “old” algorithm implemented by Google. Big G realized there was a problem with PageRank, since link authority could be passed from any page, to any page, regardless of topical relevance, making websites which got links from completely irrelevant sources rank high in search results.

The benefit of Hilltop over raw PageRank (Google) is that it is topic sensitive - and is thus generally harder to manipulate than buying some random high power off topic link would be. – seobook.com

Hilltop supposedly fixed this issue, and now a high PR link from a flower website to an automotive website does not count as it used to. There may be some value passed, but it is not as much as getting high PR link from an “authoritative” automotive site.

Hilltop is similar to Trust Rank, but more automated. It relies on “expert” documents and links from those documents, assuming:

X links to Y and Y links to Z, then X and Z are related.

The Hilltop paper also states that <titles> and <h-tags> are highly important, which is very true in everyday search engine optimization practice. Russ Jones in SEOmoz’s Search Engine Ranking Factors called the <title> tag:

the most powerful HTML tag you have at your disposal

Optimizing for Google Hilltop

Optimizing for Hilltop requires you to spot “expert documents” and essentially get links from those documents. There is nothing new here; it's Link Building 101.  Shoot for the most editorial links you can get from the most authoritative websites.

Spotting an authoritative website

The easiest way to spot an authoritative site is to look for a site in search results with an authoritative listing that includes “sitelinks.”

Site links (image example) are links below the first search result. Some websites have reached a high authority status and rank for generic terms with sitelinks. For the most part, sitelinks are shown for brand searches like “seo chat,” but once a site is shown with sitelinks for a generic term like “seo,” that website is a highly trusted authority on that topic.

Getting a link from there is worth gold.

Also look at the back link profile of the site you consider to be an “authority.” You may find the root hubs that link to the site in question are even more authoritative. Use Yahoo Site Explorer to explore backlinks, since Google dupes results for the “link:” command as anti-SEO measure.

Next: Conclusion >>
 
Google`s Trust Rank and Hilltop Algorithms - Conclusion(Page 4 of 4 )

Hilltop and TrustRank are both measures Google instituted against spam and overly aggressive search engine optimization techniques. Before both were implemented, search engine optimizers could get high PR links and dominate the top spots for competitive terms. With those algorithms in place, the game is a lot harder. Instead of hunting for PageRank alone, your link building strategy must focus on authority links first.

Mixing your link profile

Google is very good at link analysis. If you have only authority, expert and “seed” links, your link profile may look suspicious and alert algorithms that you’re doing SEO. In order to keep your link profile natural, get links from new and less trusted websites as well.

Networking with real people

It’s far easier to get authority links if you network with real people, know them in person and spend time with them. A link from the Wall Street Journal in an editorial article is worth much more than 10 links from generic directories with decent PR. If you’re a professional optimizing on your own, without outside help, then take the time to get to know people in your industry. Talk to journalists and bloggers, and make friends.

Large SEO companies often can only buy links and submit to directories. If you want to hire a company and expect to get many authoritative links, you will probably be disappointed. SEO copywriters get only several hours to research your topic… and how many years have you spent in your industry? You have the power to develop far more “authoritative” content that is interesting to experts in your field who have the golden keys to “expert pages” and “authoritative sites.” Hire an SEO company, but try unlocking the most precious links yourself.

DISCLAIMER: The content provided in this article is not warranted or guaranteed by Developer Shed, Inc. The content provided is intended for entertainment and/or educational purposes in order to introduce to the reader key ideas, concepts, and/or product reviews. As such it is incumbent upon the reader to employ real-world tactics for security and implementation of best practices. We are not liable for any negative consequences that may result from implementing any information covered in our articles or tutorials. If this is a hardware review, it is not recommended to open and/or modify your hardware. 
http://www.seochat.com/c/a/Google-Optimization-Help/Googles-Trust-Rank-and-Hilltop-Algorithms/
Comments On: Google`s Trust Rank and Hilltop Algorithms

Windows 7下载及使用Windows 7升级
艺术与科学的“姻缘”——谈文艺复兴时期艺术与近代科学兴起的关系
Google TrustRank and Hilltop
实证研究方法
一位北大CCER研究生的经济学、金融学学习感悟
潘晓《人生的路啊怎么越走越窄》
Windows XP系统端口关闭方法
世界上最牛的论文
TXP1atform.exe中毒归来
google使用技巧
我们能否预知社会
李慎之:中国传统文化中既无民主也无科学
Widget发展和Widget的各种应用
工程师的科学思想与方法
与诺贝尔奖擦肩而过的人
在别人坟墓上“跺脚”的人
最牛DIY搞定无线上网
让Windows XP死机时自动重启
内存不能为"read"和内存不能为"write"的处理
《人民日报》刊文指出潜规则盛行将危害社会文化
工程院选院士要求“品行端正” 被批太苛刻
百年前14个预言部分已成现实
身体语言密码29
现代科学研究专题其他1 现代科学研究专题其他2

本栏目主要介绍科学技术方面,包括现代科学研究成果、现代科技、现代科学技术、Google TrustRank and Hilltop等。特别关注有关人与文化的价值方面的研究。

『科学频道首页』 『本栏页首』 『关闭窗口』