尽管按照严格的SEO(搜索引擎优化)理论,让网站内的页面尽可能多、尽可能快地被搜索引擎收录未必是最佳的选择,也不会在根本上改善网站整体的SEO效果——部分人甚至认为,过于强调让网页进入搜索引擎的索引数据库,则会造成因存在大量的相关度不高或低价值的页面而影响网站整体优化的结果,特别是降低网站内重要页面的排名,毕竟,让网页出现在搜索引擎的索引数据库并不是目的,在SERP(搜索结果页面)获得高排名才是努力方向,正因为此,许多人提出不应向或最好不要向Google网站管理员中心提交 sitemaps——但是,在大多数情况下,保证网站能够被搜索引擎正确索引仍然是SEO的基础。
此外,在Internet上抄袭或“转载”已成普遍行为的今天,让自己的网页能够在第一时间内被搜索引擎索引还有另一层意义:众所周知,虽然搜索引擎在如何判断内容的原始出处可能有十分复杂的机制,但网页被其索引、收录的时间总是一个相当重要的判断因子——这也是我们关注这一问题的主要原因,近来对Vista天地的抄袭已经到了肆无忌惮的程度——从这个角度,保证自己的原创内容页面能够先于转载网站被搜索引擎收录的重要性不言而喻。当然,这并不能保证原创页面最终出现在SERP的排名会高于转载网站,那取决于很多因素。
在Sitemaps标准走向统一后,通过向Google、Yahoo!提交sitemaps可以在一定程度上提高网页被索引、收录的速度,但结果并不理想,这倒也可以理解,从根本上说,Sitemaps的的主要目标在于提高搜索引擎索引页面的全面性而非时效性。那么,是不是还有别的途径?
最近,我们进行的一项测试表明,通过Google的Blog Search可以有效地实现这一点。自去年10月份,Google Blog Search便已开始支持Ping 服务,即当Blog上增加了新内容或内容改变后可直接通知Google Blog Search,以帮助其索引、收录。测试中使用2个网站做比对,二者同时建立,均使用WordPress,域名均为新注册域名,在各搜索引擎中均不存在任何记录,均没有任何外部链接,惟一的区别便是在其中之一,姑且称为网站A吧,中设置了Ping Google Blog Search,即在WordPress的“Update Services”设置中添加了“http://blogsearch.google.com/ping/RPC2”,而另一则保持WordPress的默认设置即仅Ping “http://rpc.pingomatic.com/”。
测试结果相当令人震憾,网站A除第一篇文章用了一天时间才被收录外,其后均在一个小时内被Google blog search收录,并旋即出现在Google的主索引库中(即Google网页搜索),其中最快的一次用了不到一分钟,连文章中的错别字都未来得及修改便已被Google缓存。而网站B,则直到半个月后才被Google收录了一个页面,差距甚远。——至于没有外部链接的网站B为何也能被索引,猜测可能缘于 Ping “http://rpc.pingomatic.com/”而在Technorati中出现了链接,不过因Technorati被封,未详细检查。
当然,由于没有外部链接,网站A出现在Google网页搜索中的页面均为“补充结果”,但相信这并不是什么大问题,随着内容的逐步充实,获得足够的链接,其自然会从补充结果中逃出。
稍许令人郁闷的是,这仅对Google有效。至于如何提高搜索引擎索引、收录网页的速度,仍有待解决。
注1:在SEO、原创内容与独特内容的留言中,Cloudream认为“借助adsense可以让搜索引擎第一个抓取你的文章(发表完自己刷几次页面即可)”,但MediaBot不能收录、索引新的网页,而只在某种情况下对索引数据库中已存在页面进行更新是公认的事实,虽然我们也曾对Google的官方说法提出过质疑,但客观分析,Google在这件事上应该是没有说谎的,不然,同时维护两个功能相同或相近的索引库,在技术实现上存在很大难度,也有自找麻烦的嫌疑。
注2:虽然我们的测试在WordPress下进行,不过,使用其他blog平台甚至传统的CMS,只要能提供RSS输出,均可通过Ping Google Blog Search——或自动Ping,如无相应设置也可手工Ping——加速网页的收录与索引。
没有评论:
发表评论