当前位置: 移动技术网 > IT编程>开发语言>.net > PuppeteerSharp读取页面完整HTML(.NetCore)

PuppeteerSharp读取页面完整HTML(.NetCore)

2019年11月28日  | 移动技术网IT编程  | 我要评论

东方卫视在线直播回放,自由泳换气,横湖十顷玻璃碧

1.使用nuget安装puppeteersharp

通过工具或者命令方式安装

2.初始化浏览器

await new browserfetcher().downloadasync(browserfetcher.defaultrevision);

3.具体代码

using (browser browser = await puppeteer.launchasync(new launchoptions { headless = true }))
{
    using (var page = await browser.newpageasync())
    {
        //设置浏览器的页面大小
        await page.setviewportasync(new viewportoptions
        {
            width = 1024,
            height = 768
        });
        await page.gotoasync("http://www.baidu.com");
        var html = await page.getcontentasync();

        var sourcefile = "";
        var memorystream = new memorystream(encoding.default.getbytes(html));
        var sr = new streamreader(memorystream);
        sourcefile = sr.readtoend();
        
        //针对源代码进行分析
        var te = new textextractor(sourcefile);
        te.extract();
        sr.close();
        
        //将页面保存为图片
        //await page.screenshotasync(@"d:\1.png",
        //    new screenshotoptions() { fullpage = true, type = screenshottype.png });
    }
}

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网