赵榕佑,阎玺的微博,淳化阁帖
scrapy.http.request
自动去重,根据url的哈希值,进行去重
属性
meta(dict) 在不同的请求之间传递数据,dict
priority(int) 此请求的优先级(默认为0)
dont_filter(boolean) 关闭自动去重
errback(callable) 在处理请求时引发任何异常时将调用的函数
flags(list) 发送给请求的标志,可用于日志记录或类似目的
方法
copy() 返回一个新的请求,改请求是此请求的副本
replace() 返回一个更新对的request
formrequest
scrapy框架内置了一个formrequest类,它扩展了基类request,具有处理html表单的功能
post请求的时候,使用formrequest将数据传入formdata参数即可
日志使用
log_file 日志输出文件,如果为none,就打印在控制台
log_enabled 是否启用日志,默认true
log_encoding 日期编码,默认utf-8
log_level 日志等级,默认debug
log_format 日志格式
log_dateformat 日志日期格式
log_stdout 日志标准输出,默认false,如果true所有标准输出都将写入日志中
log_short_names 短日志名,默认为false,如果true将不输出组件名
一般只在settings配置文件中添加
如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复
新手学习Python2和Python3中print不同的用法
Python基于os.environ从windows获取环境变量
网友评论