当前位置：移动技术网 > IT编程>脚本编程>NodeJs > 使用Phantomjs和Node完成网页的截屏快照的方法

使用Phantomjs和Node完成网页的截屏快照的方法

2019年09月06日 | 移动技术网IT编程 | 我要评论

由于甲方爸爸的需要,最近使用phantomjs和node写了一个对网页内容截屏的功能，为了避免忘记,现在将代码内容及配置流程大概描述一下.

1.首先node是必须安装的,而且网上安装教程一大堆,在此不再赘述,nodejs官网链接

2.然后,第二个主人公是phantomjs,，选择对应的系统下载对应的安装包

3.将phantomjs配置为系统变量,下面是windows配置为环境变量:

配置完成之后,在cmd命令行中输入 phantomjs -v 检验是否配置成功,配置成功之后，如下图所示:

4.撸代码,通过查阅phantomjs之后,了解到使用phantomjs可以预览一个网页生成图片,pdf,base64格式等等,而我们的项目需要的并不是一个完整的网页,而是网页中的一部分内容,所以在此基础之上要改造部门内容,现在讲解一下代码:

4.1)首先是express的一些设置,由于需要执行phantomjs的命令,所以需要引入child_process模块,具体代码如下:

var process = require('child_process');//执行命令行所需
var express = require('express');//express
var bodyparser = require('body-parser');
var fs = require("fs");//文件操作
var app = express();
 
app.use('/pages',express.static('pdfs'));//设置静态资源目录
app.use(bodyparser.json({limit:'50mb'}));//请求内容大小限制
app.use(bodyparser.urlencoded({limit:'50mb',extended:false})); 
 
//设置允许跨域访问
var allowcrossdomain = function(req, res, next) {
  res.header('access-control-allow-origin', '*');
  res.header('access-control-allow-methods', 'get,put,post,delete');
  res.header('access-control-allow-headers', 'content-type');
  res.header('access-control-allow-credentials','true');
  next();
};
 
app.use(allowcrossdomain);

4.2)然后就是生成页面的base64接口的方法,如下:

app.get('/getbase64',function(req,res){
	var url=req.query.url;//读取请求中的url参数,然后访问这个url
  url=url.replace(/&/g,'%26');//将请求中的&转换 
	var resp={
	  "status":'200'
	}
	res.writehead(200,{'content-type':'text/html;charset=utf-8'});//设置响应头
	if(url==''){
    resp.msg='url参数不能为空';
    res.end(json.stringify(resp));  
	}
	else{
    //phantomjs执行的命令行 index.js在后文中给出
		var strshell='phantomjs --disk-cache=true --disk-cache-path=. index.js '+url;
    process.exec(strshell,{
    	maxbuffer:5000*1024,
    },function(error,stdout,strerr){
    	if(error!==null){
        console.log(error);
    		resp.msg='转换失败，稍后重试';
    		res.end(json.stringify(resp));
    	}else{
        //执行成功则返回base64的数据
    		resp.data=stdout;
    		res.end(json.stringify(resp));
    	}
    })
	}
 
})

4.3)phantomjs执行的脚本,即index.js,如下:

var page = require('webpage').create();//获取webpage
var system = require('system'),
  address;
 
if (system.args.length === 1) {//执行的命令应该包括请求的url，否则退出phantom
  console.log('usage: url error');
  phantom.exit();
}
address = system.args[1];//请求的地址
address = address.replace(/%26/g, '&');//phantom不能识别%26,所以转为&
page.viewportsize = {//设置viewport
  width: 1920,
  height: 1080,
}
page.open(address, function(status) {//打开页面
  settimeout(function() {//2s之后获取base64结果,如果直接生成有可能页面还没有加载完成
    if (status == 'success') {
      var base64 = page.renderbase64('png');
      console.log(base64);//将base64结果输出之后,在上边的getbase64接口中获取
      phantom.exit();
    }
  }, 2000);
})

4.4）获取页面中部分内容的截图,可以将需要截图的dom字符串,发送至后台,然后新建一个空的页面,使用phantom访问该空白页面,并将dom字符串添加到预览的页面,然后生成截图,具体代码如下:

app.post('/getpartpage', function(req, res) {
  var xmlobj = req.body.xmlobj;//获取dom字符串
  const requrl = 'http:example.com/tmp.html';//要访问的空页面
  var response = {
    "status": '200',
  };
  if (xmlobj == undefined || xmlobj == '' || xmlobj == null) {
    response.msg = 'dom字符串内容未输入';
    res.end(json.stringify(response));
  }else {
    fs.writefile('tmp.txt', xmlobj, function(err) { //由于dom字符串内容过多,所以写入txt文本
      if (err) {
        response.msg = '生成页面失败,请稍后重试';
        return res.end(json.stringify(response));
      }
 
      var strshell = 'phantomjs pages/index.js ' + requrl;//phantomjs执行的命令
      process.exec(strshell, {
        maxbuffer: 5000 * 1024,
      }, function(error, stdout, strerr) {
        if (error !== null) {
          response.msg = '脚本执行错误,请稍后重试';
          res.end(json.stringify(response));
        } else {
          response.data = stdout.replace("\r\n", "");
          res.end(json.stringify(response));//返回结果
        }
 
      })
 
    })
 
  }
 
})
 
var server = app.listen(8808,function(){ //接口监听,访问的端口
	var host = server.address().address
	var port = server.address().port
  console.log('http://%s:%s',host,port);
})

4.5)pages下的index.js内容如下所示:

var page = require('webpage').create();//获取webpage
var fs = require('fs');
var system = require('system'),
  address,filename;
 
if (system.args.length === 1) {
  console.log('usage: url error');
  phantom.exit();
}
address = system.args[1];//请求的路径
address = address.replace(/%26/g, '&');
filename = (new data()).gettime();
page.viewportsize = {
  width: 750,
}
page.papersize = { //生成a4大小的pdf文件
  format: 'a4',
  orientation: 'portrait',
  margin: '0.8cm'
}
page.open(address, function(status) {
  var info = fs.read('tmp.txt');//读取dom字符串
  var result = page.evaluate(function(info) {
    try {
      document.queryselector('#dom').innerhtml = info;//将dom字符串拼接
    } catch (e) {
      console.log(e);
    }
 
    return document.queryselector('#dom').innerhtml;//返回页面
  }, info);
  settimeout(function() {
    page.papersize = {
      format: 'a4',
      orientation: 'portrait',
      margin: '0.8cm'
    };
    page.viewportsize = {
      width: 750,
    };
    //生成pdf文件 
    page.render('pages/' + filename + '.pdf', { format: 'pdf', quality: '100' });
    console.log('http://example.com/pages/' + filename + '.pdf');//返回pdf文件的访问路径
    phantom.exit();
  }, 500);
})

ok，以上就是全部接口的内容,全部的代码可以访问进行下载.希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

使用npm命令提示: 'npm' 不是内部或外部命令,也不是可运行的程序的处理方法

在安装nodejs时候，有时候我们会把它安装在d盘或别的盘时，经常会遇到npm环境变量没有配好，需要自己手动去配置。在安装完nodejs后输入node -... [阅读全文]
Node.js API详解之 dns模块用法实例分析

本文实例讲述了node.js api详解之 dns模块用法。分享给大家供大家参考，具体如下：node.js api详解之 dnsdns (域名服务器)模块包含两... [阅读全文]
详解如何修改 node_modules 里的文件

前言有时候使用npm上的包，发现有bug，我们知道如何修改，但是别人可能一时半会没法更新，或者是我们特殊需求，别人不愿意修改，这时候我们只能自己动手丰衣足食。那... [阅读全文]
使用Typescript和ES模块发布Node模块的方法

本文主要介绍了使用typescript和es模块发布node模块的方法，分享给大家，具体如下：typescript已经成为一种非常流行的javascript语言... [阅读全文]
详解Node.js使用token进行认证的简单示例

本文只介绍简单的应用，关于json web token的具体介绍以及原理请参考阮一峰老师的json web token 入门教程。使用的node框架是koa2，... [阅读全文]
Node.js API详解之 module模块用法实例分析

本文实例讲述了node.js api详解之 module模块用法。分享给大家供大家参考，具体如下：node.js api详解之 modulenode.js 有一... [阅读全文]
Node Express用法详解【安装、使用、路由、中间件、模板引擎等】

本文实例讲述了node express用法。分享给大家供大家参考，具体如下：安装npm install --save express基本使用//引用expres... [阅读全文]
Node Mongoose用法详解【Mongoose使用、Schema、对象、model文档等】

本文实例讲述了node mongoose用法。分享给大家供大家参考，具体如下：mongoose简介是一个将javascript对象与数据库产生关系的一个框架，o... [阅读全文]
Node.js API详解之 Error模块用法实例分析

本文实例讲述了node.js api详解之 error模块用法。分享给大家供大家参考，具体如下：node.js api详解之 errornode.js 中运行的... [阅读全文]
Node.js API详解之 net模块实例分析

本文实例讲述了node.js api详解之 net模块。分享给大家供大家参考，具体如下：node.js api详解之 netnet 模块提供了创建基于流的 tc... [阅读全文]

网友评论


验证码：

使用Phantomjs和Node完成网页的截屏快照的方法

2019年09月06日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论