婚庆网站,小眯自述,尼罗河上的惨案2004
任务
在https://pastebin.com网站注册一个账号,利用python实现用户的自动登录和创建paste。该任务需要分成如下两步利用python实现:
模拟账号登录
模拟登录,需要知道登录的url是什么,那么登录url怎么去看呢。
进入https://pastebin.com/之后,发现是以访客的身份进入的,点击身份图像的下拉中的login,进入登录页面,打开chrome开发工具,选择network,勾选preserve log:
输入用户名和密码,登录进去后,如下图:
这样就找到了需要提交的请求是什么,包括url,请求方法,提交的数据。post请求是以什么格式提交的数据呢,在request header头部可以找到"content-type": "application/x-www-form-urlencoded",这个需要注意,因为经常遇到的还有一种提交形式叫"application/json"。
在用requests post提交请求的时候,如果是form表单形式传送,则将数据传入data参数,如果是以json格式传送,则需要将数据传入json参数。
登录之后,点击api菜单,可以从页面中 获取一个api_dev_key,后面实现自动创建paste的时候需要用到。
import requests from lxml import etree # 登录 https://pastebin.com/ login_url = "https://pastebin.com/login" username = "kuang123321" password = "xxxxxx" api_dev_key = "4f45a996aa78079d8f7d14f104c45893" session = requests.session() form_data = { "submit_hidden": "submit_hidden", "user_name": username, "user_password": password, "submit": "login" } headers = {"content-type": "application/x-www-form-urlencoded"} res = session.post(login_url, data=form_data, headers=headers) print(res.status_code, res.url) # 获取 api_dev_key api_url = "https://pastebin.com/api" text = session.get(api_url).content.decode("utf-8") html = etree.html(text) target_divs = html.xpath('//*[@id="content_left"]/div[9]/div/text()') if target_divs: api_dev_key = target_divs[0] print(api_dev_key) else: raise exception("cannot find api_dev_key")
如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复
Python 实现将numpy中的nan和inf,nan替换成对应的均值
python爬虫把url链接编码成gbk2312格式过程解析
网友评论