Python使用requests模块爬取百度翻译_Python

Python使用requests模块爬取百度翻译

requests模块：

python中原生的一款基于网络请求的模块，功能非常强大，简单便捷，效率极高。

作用：模拟浏览器发请求。

提示：老版使用 urllib模块，但requests比urllib模块要简单好用，现在学习requests模块即可！

requests模块编码流程

指定url

1.1 ua伪装

1.2 请求参数的处理

2.发起请求

3.获取响应数据

4.持久化存储

环境安装：

pip install requests

案例一：破解百度翻译（post请求）

1.代码如下：

#爬取百度翻译
#导入模块
import requests
import json

#ua伪装：将对应的user-agent封装到一个字典中
headers = {
    'user-agent': 'mozilla/5.0 (windows nt 10.0; wow64) applewebkit/537.36 (khtml, like gecko) '
           'chrome/57.0.2987.98 safari/537.36'}

  #网页访问连接
 url='https://fanyi.baidu.com/sug'
 #处理url携带的参数：封装到字典中
word=input("input a word: ")
data={
  'kw': word
}

#请求发送
res=requests.post(url=url,data=data,headers=headers)
#获取响应数据:json()方法返回的是obj（如果确认响应数据是json类型的，才可以使用json（））
dic_obj=res.json()

#持久化存储
filename=word+'.json'
fp=open(filename,'w',encoding='utf-8')
json.dump(dic_obj,fp=fp,ensure_ascii=false)

#打印完成提示
print('finish')

其中：

https://fanyi.baidu.com/sug 这个url的定位如下图：

2.运行结果

案例二：爬取搜狗页面数据（get请求）

1.代码如下

import requests
if __name__ == "__main__":
  #step_1:指定url
  url = 'https://www.sogou.com/'
  #step_2:发起请求
  #get方法会返回一个响应对象
  response = requests.get(url=url)
  #step_3:获取响应数据.text返回的是字符串形式的响应数据
  page_text = response.text
  print(page_text)
  #step_4:持久化存储
  with open('./sogou.html','w',encoding='utf-8') as fp:
    fp.write(page_text)
  print('爬取数据结束！！！')

2.运行结果如下：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

Python自动登录QQ的实现示例

这是一份来自网络的代码，经过了我的修改和验证。首先我的运行环境是python3.7，需要安装pyuserinput库。直接上代码吧：#!/usr/bin/pyt... [阅读全文]

解决python和pycharm安装gmpy2 出现ERROR的问题

python和pycharm安装gmpy2：pip install gmpy2出现error: command errored out with exit st... [阅读全文]

Python接口自动化测试的实现

1）环境准备：　　接口测试的方式有很多，比如可以用工具（jmeter,postman）之类，也可以自己写代码进行接口测试，工具的使用相对来说都比较简单，重点是要... [阅读全文]

Python操作Word批量生成合同的实现示例

背景：大约有3k家商家需要重新确认信息并签订合同。合同是统一的word版本。每个供应商需要修改合同内的金额部分。人工处理方式需要每个复制粘贴且金额要生成大写金额... [阅读全文]

Python 中写注释的方法

在写 python 代码的时候，一个很好的编码实践就是使得你的代码简洁，易懂。组织代码，设置变量，以及给函数有意义的名字，都是几个不错的方法。另外一个提高代码可... [阅读全文]

Python3+selenium配置常见报错解决方案

第一个坑：'geckodriver' executable needs to be in path1.如果启动浏览器过程中报如下错误traceback (mos... [阅读全文]

python实现单机五子棋

简介这是实验室2018年底招新时的考核题目，使用python编写一个能够完成基本对战的五子棋游戏。面向新手。程序主要包括两个部分，图形创建与逻辑编写两部分。程序... [阅读全文]

Python Map 函数的使用

map()是一个 python 内建函数，它允许你不需要使用循环就可以编写简洁的代码。一、python map() 函数这个map()函数采用以下形式：map(... [阅读全文]

TC气象数据下载包括NCEP的FNL(python脚本)、STI的Best_track、NOAA的SST

TC气象数据的下载，首先需要下载每一年的台风的最佳路径数据集，然后根据最佳路径数据集上的台风的时间点，经纬度去N... [阅读全文]

Python使用OpenPyXl设置Excel表格中的单元格大小（行高和列宽）

文章目录1. 按2. 设置单行和一列的长和宽3. 设置所有行和全部列的长和宽1. 按本文主要讨论 openpyx... [阅读全文]


验证码：

验证码：

Python使用requests模块爬取百度翻译

2020年08月26日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论