作者:administrator 周一, 2008年 12月 29日 12:41
对于每一个站长而言,最关键的莫过于搜索引擎(Google或者Baidu)能够正常收录,一旦网站不能正常收录则一切都是痴心妄想。为什么会出现收录困难?这是因为搜索引擎机器人是一个很简单的软件程序,它本身对站点并没有任何的理解能力,只是通过一些固有的标准来评判站点的好坏,一旦站点在写法上出现了错误,搜索引擎将无法对站点进行采集。
一:站点的robots.txt文件损坏或书写出现错误(如错别字)。
假如搜索引擎机器人错误理解robot.txt文件,则机器人可能完全无视你的网页。所以我们要确保robot.txt文件的正确性,确保网页参数正确。
二:在您的网址中使用了会话ID。
大多数搜索引擎不收录那些包含会话ID的网页,因为这类网页会导致内容的重复。所以,条件允许的话尽量避免会话ID在你网址的出现。
三:网页中包含代码过多。
网页内充斥着Java代码、CSS代码以及其他脚本代码,这些代码与网站内容并无直接联系。打开网页并且“查看源文件”,如果发现很难对网站里的实际内容做出更改,那么通常情况下搜索引擎收录起来也会很困难。次数多了,搜索引擎机器人也就不再光临你的网页了。
四:网站导航。
大多数搜索引擎机器人无法解析Java或者DHTML菜单,当然Flash以及Ajax菜单效果更差。
综上所述,搜索引擎机器人是个很简单的程序,它们往往遵循某个预先设定好标准,一旦它们遵循的HTML链接出现错误,那样的话会对收录带来困难。