当前位置: 移动技术网 > IT编程>开发语言>.net > asp.net 网页编码自动识别代码

asp.net 网页编码自动识别代码

2018年05月29日  | 移动技术网IT编程  | 我要评论

赤峰中学发生车祸,结婚红包怎么写,啤酒生产设备

复制代码 代码如下:

using system;
using system.net;
using system.text;
using system.text.regularexpressions;

class program
{
// 获取网页的html内容,根据网页的charset自动判断encoding
static string gethtml(string url)
{
return gethtml(url, null);
}

// 获取网页的html内容,指定encoding
static string gethtml(string url, encoding encoding)
{
byte[] buf = new webclient().downloaddata(url);
if (encoding != null) return encoding.getstring(buf);
string html = encoding.utf8.getstring(buf);
encoding = getencoding(html);
if (encoding == null || encoding == encoding.utf8) return html;
return encoding.getstring(buf);
}

// 根据网页的html内容提取网页的encoding
static encoding getencoding(string html)
{
string pattern = @"(?i)\bcharset=(?<charset>[-a-za-z_0-9]+)";
string charset = regex.match(html, pattern).groups["charset"].value;
try { return encoding.getencoding(charset); }
catch (argumentexception) { return null; }
}

// 程序入口
static void main()
{
console.writeline(gethtml(//www.jb51.net));

console.read();
}
}

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网