打印本页〗〖打印选项
如何提高网站在Google中的排名
   谁不想自己的网站在Google的搜索结果重排名靠前呢,但你的网站设计是Search Engine Ready的吗?本文介绍了网站设计中面向搜索引擎的优化注意事项。  

什么是PageRank
Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考Google の秘密 - PageRank 徹底解説一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的,由此引出第一个要点:

链接就是一切
在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。

Blogger(Weblog简称Blog)们也许最深刻的理解了这句话的含义,Blogger之间有大量相互链接,因此最经常被引用的页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。

在推广自己网站之前也许首先需要自己网站在一些搜索引擎中的知名度,有一个小工具:link popularity check。原理可以参考:如何评价网站的人气一文。

例子1:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的。
网站推广比较经典的方式就是加入比较大型网站的分类目录,比如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要从大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自大网站任何地方的反相链接都是非常有价值的,只要是出现在新闻报道,论坛,邮件列表归档,关键是要多,而且是权重高的高层页面,我的网站没有加入任何分类目录,而是将一些文章投稿在了ZDNet中国上,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。

例子2:被PageRank高的网站引用能更快地提高PageRank。
被什么样的网站引用有时候比引用次数多更重要,我的文章被ZDNet中国引用以后,相应网页的权重升高非常快。这里我要特别感谢的是,ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。

例子3:投搜索引擎所“好”
Lucene简介这篇文章被Jakarta.apache.org的lucene项目引用以后,这篇文章就成为了所有页面中PageRank最高的页面(在Google工具栏上显示是6/10),而Google深厚的学院气氛让我一直怀疑他们对.org .edu等非功利站点有特别加分 :-)。

   网站推广只是手段,如何突出内容,让需要相关信息的用户能够尽快的找到你的网站才是目的,第二个要点:

标题和关键词的重要性
不要空着标题:空着<title></title>;
传统的页面中,会有类似以下的信息:用于说明网页的主题
<header>
<meta name="keyword" content="mp3 download music...">
</header>
后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新的搜索引擎已经不再关心页面头文件中的meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。
标题长度:不要过长,一般在40个字符以内;如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。
标题内容:尽量用一些别人可以通过关键词找到的字眼;"Website search engine optimization" 会比"面向搜索引擎的网站设计优化"有效的多。
如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
我的猜测:搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
http://www.chedong.com/phpMan.php是我的网站上的一个小应用:一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:  [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
除了<title></title>外,还可以用<h1></h1>标题行突出内容主题,加强标题的效果;
在我的网站设计中:我会把用<h1>[标题]</h1>这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
其他网站设计提示
表现和内容的分离:
网页中的javascript和css尽可能和网页分离,一方面提高代码重用度(也方便页面缓存),另外一方面,由于有效内容占网页长度的百分比高,也能提高相关关键词在页面中的比重,应该鼓励使用更规范的XHTML和XML作为显示格式便于内容更长时间的保存。
站点地图:让所有的页面都有能够快速入口,方便网页爬虫(spider)快速遍历网站所有需要发布的内容。提高网站自身的健康状态:经常利用坏链检查工具(比如:XENU)生成网站地图统计,并检查网站中是否有死链。
尽可能保持网页的持久性,保证引用你的网页能够被比较持久的稳定引用,如果网页中有链接更新时,最好能保留旧的页面并做好链接转向,保持内容的连续性。


知己知彼——站点访问统计/日志分析挖掘的重要性

    网站设计不仅仅只是被动的迎合搜索引擎的索引,更重要是充分利用搜索引擎带来的流量进行更深层次的用户行为分析。目前,搜索引擎关键词统计几乎是各种日志分析工具的标准功能,日志统计这个功能如此重要,以至于新的RedHat 8中已经将日志分析工具webalizer作为标准的服务器配置应用之一。相信商业日志统计工具在这方面应该会有更强化的实现。

以Apache/webalizer为例,具体的做法如下:

记录访问来源:
在Apache配置文件中设置日志格式为combined格式,这样的日志中会包含扩展信息:其中有一个字段就是相应访问的转向来源:HTTP_REFERER,如果用户是从某个搜索引擎的搜索结果中找到了你的网页并点击过来,日志中记录的HTTP_REFERERL就是用户在搜索引擎结果页面的URL,这个URL中包含了用户查询的关键词。
在webalizer中缺省配置针对搜索引擎的统计:如何提取HTTP_REFERER中的关键词
webalizer中缺省有针对yahoo, google等国际流行搜索引擎的查询格式:
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google.com q=
    通过这样设置webalizer统计时就会将HTTP_REFERER中来自搜索引擎的URL中的keyword提取出来,比如:所有来自google.com链接中,参数q的值都将被作为关键词统计下来,从汇总统计结果中,就可以发现用户是根据什么关键词找到你的次数,以及找到你的用户最感兴趣的是那些关键词等,进步的,在webalizer中有设置还可以将统计结果倒出成CSV格式的日志,便于以后导入数据库进行历史统计,做更深层次的数据挖掘等。

    以前通过日志的用户分析主要是简单的基于日志中的访问时间/IP地址来源等,很明显,基于搜索引擎关键词的统计能得到的分析结果更丰富、更直观。因此,搜索引擎服务的潜在商业价值几乎是不言而喻的,也许这也是Yahoo! Altavista等传统搜索引擎网站在门户模式后重新开始重视搜索引擎市场的原因,相信以后会有更多的利用互联网媒体做深层次数据挖掘的服务模式出现。
关键词:
Google PageRank internet advertizing Link Farm 互联网 广告 搜索引擎 Paid Inclusion Service

内容摘要:
如果说新一代搜索引擎Google所依赖的PageRank技术更真实的突出了超链接(hyperlink)在互联网中互联互通的本质,大型门户网站是否也应该反思一下“注意力经济”时代的广告投放/统计模式,也许顺应这个潮流让广告回归到最原始的静态链接形式,间接提升广告客户自身网站在大型搜索引擎中的排名也许更能突出大型门户网站自身的优势。

你也完全不必耐心的看完后面所有的内容,因为结论无非以下一句话:

互联网上链接就是一切:来自其他网站直接静态链接是唯一对提升自身站点PageRank有长期作用的广告形式

互联网广告业的发展历程回顾
DoubleClick对NetGravity的收购标志着传统门户网站面向“注意力经济”的广告模式已经发展的相当成熟了。当时的互联网广告的优势在于很强目标性投放和来自第3方的客观统计,但由于来自用户浏览器信息的局限性,广告投放要达到很高的目标性而且不影响投放效率的话,其投放成本也是非常高的,可以想象一下一个针对浏览者所在的地区(北京,上海)进行的广告投放的难度:投放系统需要在几十毫秒内针对浏览器的IP信息映射出用户所在的地区,并从几百个正在运行的广告中找到相应的内容进行投放。

同样的,由于来自用户浏览器的信息的贫乏,统计结果对于大多数客户来说除了投放总量控制外几乎没有更多的意义。而广告客户自身往往缺乏对其进行深度加工的知识和工具从而忽略了对投放统计的深度分析。之后的发展趋势大家也能感受的到:广告幅面越来越大,位置越来越扎眼,下载速度越来越慢……,可以说传统互联网广告模式已经陷入了广告形式越来越“霸道”,但广告点击率越来越低的恶性循环。毕竟广告幅面的增加和广告位的增加都是有尽头的。

点击率的不断下降也促使广告客户在考虑:与其为10万个根本不关心我产品的用户花钱,不如为100个真正有需求的用户花钱。搜索引擎的关键词无疑比用户的浏览器更直接的表达了用户的需求。以至于随后出现的以Oventure为代表的搜索引擎结果排名模式,以其更高的针对性投放机制和简洁的形式立刻成为整个互联网广告行业中的亮点。

而最近Yahoo!对Inktomi的收购,Overture对AltaVista的收购都说明传统门户日益感受到来自Google等新一代搜索引擎门户的威胁。而且从近2年Google的在用户使用的搜索引擎排名中的上升速度来看,2003年Google的用户将超过Yahoo!几乎是必然的。

因为如果最终用户越来越多的通过搜速引擎来主动寻找信息的话,那么对于大量急需推广自身的中小网站来说除了自身的UI设计要用户友好(User Friendly)外,对搜索引擎友好度(Spider friendly)也是一个必须考虑的问题。随着越来越多的广告客户重视自身站点在大型搜索引擎中的排名,只要看一下各个门户网站的新闻页面的源代码就可以知道:大部分门户网站的广告其实是通过DoubleClick的广告投放系统进行的,其内容是一小段在浏览器客户端运行的javascript脚本,而其中的javascript脚本及其运行后所显示出来的文字等是不可能被搜索引擎的Spider识别并收录到索引中的。而且大部分广告的链接都是要先经过统计系统然后才转向到客户页面,因此这种通过动态发布/统计的广告其实对广告客户自身站点在所有搜索引擎中的排名提升没有任何意义,如果搜索引擎的内容提取做的好的话,甚至页头页尾部分内容都根本不会进入到索引里,真正能够进入搜索引擎索引的只是新闻内容本身的部分。

反过来说:作为大型门户网站本身也应该意识到自己网站内容本身对Google的排名算法的极大影响力,如果对这种影响力加以充分的利用也许有可能成为一种很重要的广告资源。对于中小网站来说短时间内能大大提高自身站点在搜索引擎中排名的无疑是来自高PageRank的门户站点并且能被搜索引擎识别的直接链接。而门户站点目前所拥有的正是这些高PageRank,然而同时又大量浪费着广告投放资源而且广告投放率低下的内容页面(包括旧有的)。

如果中小广告客户认可:到被大型门户站点高PageRank的页面“直接链接”本身带来的搜索引擎排名提升的价值远比短期的用户点击统计有价值的多。那么基于静态链接的Link Farm式广告就可以彻底放弃以前的广告模式中需要大量资源进行的面向用户浏览的动态发布和面向点击统计的动态转向统计。

以下提出的基于链接工厂(Link Farm)的广告模式也许才是一个能够充分利用门户网站的资源优势的模式:
回归最原始的静态链接形式广告,门户站点利用自身拥有的大量高PageRank的页面成为制造链接的工厂(Link Farm),间接帮助广告客户自身网站迅速提高在所有搜索引擎中的排名。而搜索引擎网站反过来向门户网站要求

大型门户网站和中小网站在“面向用户的注意力”方面有的只是量的优势,但在“面向搜索引擎的注意力”方面则同时拥有质和量的优势:

在搜索引擎中大型门户网站的页面PageRank非常高:可能随便一篇文章页面的PageRank就高达3,这个值已经超过多很多中小型网站首页的PageRank值。
拥有更高的索引更新频率:如果Google对一般站点的索引更新周期是3个星期左右,那么对门户站点就是是每5天,甚至对门户首页甚至是每天更新。
内容管理优势:目前大部分搜索引擎对动态网页是不索引或者少量索引的。和中小网站内容大部分使用动态网页发布不同,大部分大型门户网站的页面都是通过发布系统生成的静态页面,并有长期的存储,非常适合搜索引擎抓取,
成本降低:充分利用原先广告投放率及其低的内容页面:考虑到目前大部分门户网站在底层内容页面上的广告投放率远远低于5%,却占用了带宽和管理成本的60%以上。而且链接工厂模式不是面向统计的:可以脱离目前成本极高的第3方动态广告投放量体系,大大降低了门户网站的广告运营成本。
从广告客户角度:无论从那个角度来说,DoubleClick的统计都是鸡肋

大投放量的首页客户:比如汽车,手机等是否真的很看重可怜的千分之5的点击率,而门户网站为了这千分之5的点击率,牺牲的是99.5%用户的下载速度。
中小投放量的广告客户是否认可在搜索引擎中长期的排名提升比短期的广告统计更有价值,客户是否愿意牺牲在门户站点的低点击率统计,换取在搜索引擎中结果中长期的排名提升。即中小广告客户是否真的相信“Google就是上帝”。

从最终用户角度最直接的感受:
早在2001的统就就显示:“比起富媒体(RichMedia),消费者更钟情显示速度快的网站”。如果门户网站不想浪费带宽资源,图片广告应该减少,同时由于静态文字链接广告可以作为内容的一部分直接包含在页面中,也减少了对服务器的请求次数,纯文本链接的形式会增加将大大提高用户的下载速度。

从搜索引擎服务商角度:
毕竟以上所有的依据都是搜索引擎的排名算法策略,门户会更加依赖于搜索引擎的权威性,而且搜索引擎服务商甚至可以据此要求门户网站为自己的索引服务“竞价”:比如增加索引更新频率,增大站点的索引范围等,以间接增加网页在结果中的出现几率和范围,在国外称之为付费索引服务:Paid Inclusion Service。

此外,门户网站和搜索引擎服务商对用户搜索关键词的日志也是一种非常有潜力的资源。比如对汽车经销商来说,也许能从搜索引擎的关键词历史统计中得到最近一段时间各种品牌车型的用户查询数,如果得到完整的WEB日志,甚至可以利用数据仓库工具对日志进行多维的分析挖掘,从而提前数月知道某种车型的销售潜力等。进一步的甚至可以通过日志中的IP地址得到消费者的地域分布等。这种分析对于面向最终消费的商业用户将非常有吸引力。(原文)



文章作者:未知