相信有很多朋友深受baidu spider的苦,经常被扒去上G流量;如果不是水平差,那就是故意这么做。今天花点时间写了apache antibot module,结合mod_setenvif 和 mod_limitipconn两个module的思路,达到对特定user agent的ip连接数量限制。

2006/05/16 更新:修改了NoBot参数的匹配规则。上版本用的是PCRE匹配,多个匹配起来比较麻烦,改成了用空格分隔的区分大小写字符串匹配
NoBot "audio/ video/" "Google Baidu" 将匹配audio和video文件,GoogleBot和Baiduspider都会被404错误。

2006/05/14 更新:增加NoBot参数,可以让bot不索引你的某些文件(比如mp3,wmv)。
apache带的mime.types文件内容比较老,把wmv加到video/mpeg行的后面支持wmv

源代码下载

显示正文 »

Keywords: , , ,


7 Responses to “Apache补丁 anti searchbot module(2006/05/16 updated)”  

  1. 1 virushuo

    gooooooooood!

  2. 2 is

    啊哈哈哈,老大原来天天和baidu bot做斗争阿......,同情中阿.

  3. 3 tinyfool

    Cooooooooool!

  4. 4 Q

    被baiduspider搞得比较惨,占去N多流量,实在是痛苦

  5. 5 qeqw

    建议大家都用spider类的东西,搞一下百度如何?

  6. 6 succ

    用robot不是就可以屏蔽了吗??
    难道baidu spider可以不遵守规则??

  7. 7 Q

    据说baidu spider是不遵守规则,这个module纯粹是为了防止被扒流量;如对流量不敏感,可不用它 ;)

Leave a Reply



天气信息