Python正则表达式匹配HTML页面编码_Python

Python正则表达式匹配HTML页面编码

html页面一般都会指定一个编码，如何获取到是处理html页面的第一步，因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个：

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
   '<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
   '<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
   '<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
   ]



b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"


B = re.compile(b, re.IGNORECASE)


for ax in a:
  r1 = B.search(ax)

  if r1:
    print r1.group()
    print r1.group(1), len(r1.group())
  else:
    print 'not match'

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

Python自动登录QQ的实现示例

这是一份来自网络的代码，经过了我的修改和验证。首先我的运行环境是python3.7，需要安装pyuserinput库。直接上代码吧：#!/usr/bin/pyt... [阅读全文]

解决python和pycharm安装gmpy2 出现ERROR的问题

python和pycharm安装gmpy2：pip install gmpy2出现error: command errored out with exit st... [阅读全文]

Python接口自动化测试的实现

1）环境准备：　　接口测试的方式有很多，比如可以用工具（jmeter,postman）之类，也可以自己写代码进行接口测试，工具的使用相对来说都比较简单，重点是要... [阅读全文]

Python操作Word批量生成合同的实现示例

背景：大约有3k家商家需要重新确认信息并签订合同。合同是统一的word版本。每个供应商需要修改合同内的金额部分。人工处理方式需要每个复制粘贴且金额要生成大写金额... [阅读全文]

Python 中写注释的方法

在写 python 代码的时候，一个很好的编码实践就是使得你的代码简洁，易懂。组织代码，设置变量，以及给函数有意义的名字，都是几个不错的方法。另外一个提高代码可... [阅读全文]

Python3+selenium配置常见报错解决方案

第一个坑：'geckodriver' executable needs to be in path1.如果启动浏览器过程中报如下错误traceback (mos... [阅读全文]

python实现单机五子棋

简介这是实验室2018年底招新时的考核题目，使用python编写一个能够完成基本对战的五子棋游戏。面向新手。程序主要包括两个部分，图形创建与逻辑编写两部分。程序... [阅读全文]

Python Map 函数的使用

map()是一个 python 内建函数，它允许你不需要使用循环就可以编写简洁的代码。一、python map() 函数这个map()函数采用以下形式：map(... [阅读全文]

TC气象数据下载包括NCEP的FNL(python脚本)、STI的Best_track、NOAA的SST

TC气象数据的下载，首先需要下载每一年的台风的最佳路径数据集，然后根据最佳路径数据集上的台风的时间点，经纬度去N... [阅读全文]

Python使用OpenPyXl设置Excel表格中的单元格大小（行高和列宽）

文章目录1. 按2. 设置单行和一列的长和宽3. 设置所有行和全部列的长和宽1. 按本文主要讨论 openpyx... [阅读全文]


验证码：

验证码：

Python正则表达式匹配HTML页面编码

2018年07月05日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论