当前位置：移动技术网 > 网络运营>服务器>Linux > apache禁止搜索引擎收录、网络爬虫采集的配置方法

apache禁止搜索引擎收录、网络爬虫采集的配置方法

2019年05月01日 | 移动技术网网络运营 | 我要评论

apache中禁止网络爬虫，之前设置了很多次的，但总是不起作用，原来是是写错了，不能写到dirctory中，要写到location中

<location />

setenvifnocase user-agent "spider" bad_bot

browsermatchnocase bingbot bad_bot

browsermatchnocase googlebot bad_bot

order deny,allow

#下面是禁止soso的爬虫

deny from 124.115.4. 124.115.0. 64.69.34.135 216.240.136.125 218.15.197.69 155.69.160.99 58.60.13. 121.14.96. 58.60.14. 58.61.164. 202.108.7.209

deny from env=bad_bot

</location>

这是禁止了所有包含spider字符的爬虫。
如果要针对性的禁止爬虫，改成精确匹配的爬虫字符串，如果bingbot、googlebot等等

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

【嵌入式】交叉编译移植 i2cTool4.1 史上最详细

一、i2ctool 介绍i2c-tools工具是一个专门调试i2c的，开源，可获取挂载的设备及设备地址，还可以在... [阅读全文]
荐 23-TensorFlow2.2+Keras版本新特性---自动图

基于autograph的tf.keras流程tensorflow-gpu安装查看版本tf.keras简单编程流程... [阅读全文]
ZYNQ 双核运行并交互，一个linux，一个裸核

zynq 7000 一般有2个cpu （arm A9)，我们一般都用一个cpu0，本实验让2个cpu 都运行起来... [阅读全文]
荐 Flutter：最难搞的搭建环境，一次性成功！（新手踩坑）

进入我的主页，查看更多Flutter的分享！我的电脑是Win10系统（专业版最新版本）；如果你是Linux系统... [阅读全文]
ZABBIX自定义监控指定的LINUX磁盘分区,并配置触发器产生告警

在ZABBIX客户端机器当中,有一台是挂载了WINDOWS分区的,设置该分区空闲的空间小于15%的时候触发告警服... [阅读全文]
Android7以上读写/data/data下其他APP私有文件的注意点

这里写自定义目录标题问题来源主要问题最终解决办法问题来源主要是因为从Android7以上，安卓的权限开始变得很严... [阅读全文]
云计算服务模式及应用

一、服务模式云计算的服务模式分为三类：IaaS(Infrastructure as a Service,基础设施... [阅读全文]
荐 MnasNet：经典轻量级神经网络搜索方法 | CVPR 2019

论文提出了移动端的神经网络架构搜索方法，该方法主要有两个思路，首先使用多目标优化方法将模型在实际设备上的耗时融入... [阅读全文]
【实时数仓篇】（02）基于 Flink 的典型 ETL 场景实现

本文是学习Flink中文社区实时数仓篇的总结，讲师：讲师：买蓉（美团点评高级技术专家）。 ... [阅读全文]
Appium元素定位--id元素

**引言：**与Web自动化测试一样，app自动化测试过程中最重要一个环节就是元素定位，只有准确定位到了元素才能... [阅读全文]

网友评论


验证码：

apache禁止搜索引擎收录、网络爬虫采集的配置方法

2019年05月01日 | 移动技术网网络运营 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论