当前位置：移动技术网 > IT编程>开发语言>.net > C# 实现抓取网站页面内容的实例方法

C# 实现抓取网站页面内容的实例方法

2017年12月12日 | 移动技术网IT编程 | 我要评论

冯敬,水下录像,元旦手抄报版面设计图

抓取新浪网的新闻栏目，如图所示：

使用谷歌浏览器的查看源代码：通过分析得知，我们所要找的内容在以下两个标签之间：

复制代码代码如下:

内容。。。。

如图所示：

内容。。。。

使用vs建立一个如图所示的网站：

我们下载网络数据主要通过 webclient 类来实现。

使用下面源代码获取我们选择的内容：

复制代码代码如下:

protected void enter_click(object sender, eventargs e)
        {
            webclient we = new webclient(); //主要使用webclient类
            byte[] mydatabuffer;
            mydatabuffer = we.downloaddata(txturl.text); //该方法返回的是字节数组，所以需要定义一个byte[]
            string download = encoding.default.getstring(mydatabuffer); //对下载的数据进行编码

//通过查询源代码，获取某两个值之间的新闻内容
            int startindex = download.indexof("");
            int endindex = download.indexof("");

            string temp = download.substring(startindex, endindex - startindex + 1); //截取新闻内容

lblmessage.text = temp;//显示所截取的新闻内容
}

效果如图：

最后: 除了把下载的数据保存为文本以外，还可以保存为文件类型和流类型。

复制代码代码如下:

webclient wc = new webclient();
            wc.downloadfile(textbox1.text, @"f:\test.txt");
            label1.text = "文件下载完成";

复制代码代码如下:

webclient wc = new webclient();
            stream  s =  wc.openread(textbox1.text);

            streamreader sr = new streamreader(s);
            label1.text =  sr.readtoend();

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Blazor server side 自家的一些开源的, 实用型项目的进度之 CEF客户端

距离上次提出 [Asp.Net Core] Blazor Server Side 扩展用途 - 配合CEF来制作带浏览器核心的客户端软件的想法后,&#... [阅读全文]
武装你的WEBAPI-OData入门

本文属于OData系列目录（可能会有后续修改） "武装你的WEBAPI OData入门" 武装你的WEBAPI OData便捷查询武装你的WEBAP... [阅读全文]
.NET IoC模式依赖反转(DIP)、控制反转(Ioc)、依赖注入(DI)

依赖倒置原则(DIP) 依赖倒置(Dependency Inversion Principle,缩写DIP)是面向对象六大基本原则之一。他是指一种特定的... [阅读全文]
DevExpress+Winform（四）

视频：https://www.bilibili.com/video/BV15x411x7WN?p=5 新建Devexpress Winform Blan... [阅读全文]
Jenkins之Nunit的应用

一、在Jenkins中安装Nunit插件进入jenkins的插件管理模块，下载Nunit插件。此步骤不做截图说明二、引用nunit.console的nu... [阅读全文]
vue+.netcore可支持业务代码扩展的开发框架 VOL.Vue 2.0版本发布

框架介绍这是一个基于vue、element-ui、iview、.netcore3.1 可支持前端、后台动态扩展业务代码快速开发框架。框架内置定制开发... [阅读全文]
微信退款（在.net core 用http方式请求）

微信JSAPI支付申请退款接口地址接口链接：https://api.mch.weixin.qq.com/secapi/pay/refund 是否需... [阅读全文]
Owin Katana 的底层源码分析

最近看了一下开源项目asp.net katana，感觉公开的接口非常的简洁优雅，channel 9 说是受到node.js的启发设计的，Katana是一... [阅读全文]
jenkins发布application且并运行

一、发布配置差异配置：编译内容编译目标NetWorkClient/KJ90NetClient.csproj编译命令/t:build/p:Configur... [阅读全文]
WPF 简易日期控件魔改ListBox

先上截图修正：应该将SetTime方法修改为，行号为207行开始修改 var nk = Day_of_week(year, month, 1); i... [阅读全文]

网友评论


验证码：

C# 实现抓取网站页面内容的实例方法

2017年12月12日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论