前端就有了对 headless 浏览器的需求,最多的应用场景有两个
也就有了很多杰出的实现,前端经常使用的莫过于 和 ,但两个库有一个共性——难用!环境安装复杂,api 调用不友好,1027 年 chrome 团队连续放了两个大招 headless chrome 和对应的 nodejs api puppeteer,直接让 phantomjs 和 selenium ide for firefox 作者宣布没必要继续维护其产品.
如同其 github 项目介绍:puppeteer 是一个通过 devtools protocol 控制 headless chrome 的 high-level node 库,也可以通过设置使用 非 headless chrome
我们手工可以在浏览器上做的事情 puppeteer 都能胜任
puppeteersharp
puppeteer sharp是官方node.js puppeteer api的.net 移植
这个项目很活跃,大家可以通过作者博客上获取更新记录
博客园里有一篇文章 puppeteersharp+anglesharp的爬虫实战之汽车之家数据抓取:https://www.cnblogs.com/vallen/p/puppeteersharp-anglesharp-crawlersamples.html 更详细的介绍了如何使用puppetersharp。在github上还有一个puppetersharp的扩展项目:
相关文章:
如对本文有疑问, 点击进行留言回复!!
开发者们,鸿蒙HMS全球应用创新大赛喊你来拿100万美元大奖!
SqlServer在附加数据库时提示:无法打开物理文件**.mdf 操作系统错误拒绝访问
欧拉函数 - Visible Lattice Points - POJ 3090
网友评论