seo实战密码(电子版)doc
搜索引擎工作过程非常复杂,接下来的几节我们简单介绍搜索引擎是怎样实现网页排名的。这里介绍的内容相对于真正的搜索引擎技术来说只是皮毛,不过对SEO人员已经足够用了。
搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面
和浏览器一样,搜索引擎蜘蛛也有标明自己身份的代理名称,站长可以在日志文件中看到搜索引擎的特定代理名称,从而辨别搜索引擎蜘蛛,下面列出常见
为了抓取网上尽量多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就好像蜘蛛在蜘蛛网上爬行一样,这也就是搜索引擎蜘蛛这个名称的由来。
整个互联网是由相互链接的网站及页面组成的,从理论上说,蜘蛛从任何一个页面出发,顺着链接都可以爬行到网上的所有页面,当然,由于网络及页面链接结构异常复杂,蜘蛛需要采用一定的爬行策略才能遍历网上的所有页面。
所谓深度优先,指的是蜘蛛沿着发现的链接一直向前爬行,知道前面再也没有其他的链接,然后返回到第一个页面,沿着另一个链接再一直往前爬行。
广度优先是指蜘蛛在一个页面上发现多个链接时,不是顺着一个链接向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面山发现的链接爬向第三层页面。
(备注:先说这么多让大家参考下吧,主要目地在于上传文档让大家了解下,需要的可以给我留言,我随时在线回复大家,并给大家分享seo实战密码这本书的电子版!)