搜索引擎蜘蛛在做什么

搜索引擎蜘蛛在做什么

搜索引擎是什么呢?搜索引擎首先必须拥有一个庞大网页资料库,这里保存了所以改搜索引擎收录的网站内容副本,然后通过高超 的算法,这个算法是关键, 让客人输入某个关键字的时候,判断哪些信息是客人想要的,然后将算法最有用的信息呈现给客人。那么,搜索引擎是怎么样建立起这个庞大的数据呢?其实就是一 些自动下载网站的程序,这些程序被称为“蜘蛛”或者“爬虫”,或许还有别的叫法,但是都表达它们像蜘蛛一样在网上爬来爬去,目的是得到别的网站的资料,如 果你有幸被“蜘蛛”爬到了,那么恭喜,这说明搜索引擎收录了网站内容。这其实搜索收录资料的过程。

     然而这个机器“蜘蛛”显然没有现实生活中的蜘蛛那么聪明和灵活,它中规中矩,但也铁面无私。对于网站来说,搜索引擎“蜘蛛”是一“视”同仁的,它基本上只 能看到纯文本信息,然后带走,有个网站为了效果,使用了大量的Flash,图片等非文本的媒体,如果将重要信息放在多媒体里面,那么搜索引擎“蜘蛛”是不 会看见的,“蜘蛛”看不见的话,后果就是客户也不能通过搜索引擎搜索到该网站。

    所以,如果需要进行SEO,那么应该用“蜘蛛”的眼睛来观察网页,而且要将重要的、关键的信息一定要让“蜘蛛”看到。那么,这个时候就需要搜索引擎蜘蛛模 拟器来完成,通过这个模拟器就可以看到在搜索引擎中,哪些信息被抓走了,比如某网站主要关键字是“网络营销”,可是为了突出,全部使用了GIF动画来制作 “网络营销”这些文字(当然,没人会这样,只是打个比方),对于“蜘蛛”来说它就看不到,而且搜索引擎也可能不会认为这个网站在讨论“网络营销”所以自然 就没有办法客户搜索“网络营销”的时候出现该网站的结果。

     搜索引擎蜘蛛模拟器的原理就是模仿搜索引擎的抓取器,其实也相当于早年的纯文本浏览器,只能看见文字,而且目前搜索引擎主要也是通过文本查找来定位信息。通过搜索引擎蜘蛛模拟器得到了结果后,SEO优化人员可以从多方面进行优化,一般有主要如下方面:

  1. 将重要文字信息从多媒体转换成纯文字。
  2. 将语义不完整的内容添加。
  3. 保持该页的主题,去掉不相干的文字。
  4. 其他一些内容上的处理。

     搜索引蜘蛛模拟器使用也非常简单,大部分搜索引擎蜘蛛也是在线的,只需要简单的输入网址就可以看到结果,结果一般包括一下几个方面:

  1. 整个网页(包括标题)的所有纯文本信息
  2. 该网页所有的链接
  3. 该网页的Meta Keywords
  4. 该网页的Meta Description

     通过以上结果就可以为SEO动作提供参考。

版权所有,禁止转载. 如需转载,请先征得博主的同意,并且表明文章出处,否则按侵权处理.

    分享到:

2 Replies to “搜索引擎蜘蛛在做什么”

留言

你的邮箱是保密的 必填的信息用*表示