搜索引擎蜘蛛在做什么

搜索引擎蜘蛛在做什么

搜索引擎是什么呢?搜索引擎首先必须拥有一个庞大网页资料库,这里保存了所以改搜索引擎收录的网站内容副本,然后通过高超 的算法,这个算法是关键, 让客人输入某个关键字的时候,判断哪些信息是客人想要的,然后将算法最有用的信息呈现给客人。那么,搜索引擎是怎么样建立起这个庞大的数据呢?其实就是一 些自动下载网站的程序,这些程序被称为“蜘蛛”或者“爬虫&rdq更多... “搜索引擎蜘蛛在做什么”

搜索引擎蜘蛛模拟器

搜索引擎蜘蛛模拟器

本人打算使用浏览器来模拟各大蜘蛛来看爬行我的网站的结果,而蜘蛛与普通用户访问最大的区别就在于http的request的header的
HTTP_AGENT_USER
的不同,详细关于这部分的信息,请参看我的另外一篇博文:

服务器端如何判断访问来自用户还是搜索引擎的蜘蛛

服务器端如何判断访问来自用户还是搜索引擎的蜘蛛

而我发现Firefox, Chrome, Safari都没办法让你更改这个值,… 更多... “搜索引擎蜘蛛模拟器”

出名的搜索引擎蜘蛛名称

出名的搜索引擎蜘蛛名称

 
我在另外一篇文章中列出了

服务器端如何判断访问来自用户还是搜索引擎的蜘蛛

 

 

这样需要知道各个蜘蛛的名字,下面就列出了出名的搜索引擎蜘蛛名称。

------------------------------------------

Google的蜘蛛: Googlebot
更多... “出名的搜索引擎蜘蛛名称”

服务器端如何判断访问来自用户还是搜索引擎的蜘蛛

服务器端如何判断访问来自用户还是搜索引擎的蜘蛛

 

一般都是通过检测

$_SERVER['HTTP_USER_AGENT']

的值来判断,如果是普通用户,这个值就是用户所用的浏览器的名字如:

Mozilla之类的

如果是百度爬虫,那么这个值是

Baiduspider

 

所以我们代码可以这样来判断,假设是php

function is_crawler() {
    $use
更多... “服务器端如何判断访问来自用户还是搜索引擎的蜘蛛”

同步wordpress博客到新浪博客,网易博客,百度空间,天涯博客

同步wordpress博客到新浪博客,网易博客,百度空间,天涯博客

 

新浪博客,网易博客,百度空间,天涯博客都是权重很高的第三方博客平台。如果能保持更新,有助于提升主站权重。有了博客同步插件,直接在wordpress 后台设置一下,wordpress 自动把更新的日志同步到其他博客上。强大的wordpress文章同步插件

WP2HiBaidu

自动把博客更新同步到百度空间。同步文章时,自动插入原文… 更多... “同步wordpress博客到新浪博客,网易博客,百度空间,天涯博客”

使用新浪微博登陆 WordPress 博客

使用新浪微博登陆 WordPress 博客

 

 

新浪微博连接的主要功能

  • 使用新浪微博账号登陆 WordPress 博客,新浪微博连接插件会在留言框,注册页面,登录页面都会加入使用新浪微博连接的按钮,你只要几次点击,然后到新浪微博进行简单的验证就能使用新浪微博账号登陆 WordPress 博客。

  • 同步留言到新浪微博,新浪微博连接插件会在留言框增加一个选项,让用户选择是否把自己的留言同步到新浪微博,

更多... “使用新浪微博登陆 WordPress 博客”

保护你的wordpress之防止恶意注册

最经我的wordpress有很多人注册,并且呈现上升趋势,并且这些用户注册很久也没有评论和发表文章,所以很有可能是恶意注册。你是不是也碰到了同样的事情呢?又该怎么办?

第一 先删除这些已经注册,并且你认为可能是垃圾用户的用户

方法是去管理员面板,然后点击用户,再点击所有用户,删除它。

 

第二 防止此类用户再次注册,这种用户一般由机器人注册

这一步可由一些插件帮你完成,我推荐几个:

User spam re更多... “保护你的wordpress之防止恶意注册”