当前位置：移动技术网 > IT编程>开发语言>Java > java实现PPT转PDF出现中文乱码问题的解决方法

java实现PPT转PDF出现中文乱码问题的解决方法

2019年07月22日 | 移动技术网IT编程 | 我要评论

ppt转成pdf，原理是ppt转成图片，再用图片生产pdf，过程有个问题，不管是ppt还是pptx，都遇到中文乱码，编程方框的问题，其中ppt后缀网上随便找就有解决方案，就是设置字体为统一字体，pptx如果页面是一种中文字体不会有问题，如果一个页面有微软雅黑和宋体，就会导致部分中文方框，怀疑是poi处理的时候，只读取第一种字体，所以导致多个中文字体乱码。

百度和谷歌都找了很久，有看到说apache官网有人说是bug，但他们回复说是字体问题，这个问题其实我觉得poi可能可以自己做，读取原来字体设置成当前字体，不过性能应该会有很多消耗，反正我估计很多人跟我一样花费大量时间找解决方案，网上几乎没有现成的方案。自己也是一步步尝试，最终找到解决办法，ppt格式的就不说了网上找得到，pptx后缀的网上我是没找到。

问题前的pptx转成图片：

解决后的pptx转成图片：

解决方法：
读取每个shape，将文字转成统一的字体，网上找到的那段代码不可行，我自己改的方案如下：

for( xslfshape shape : slide[i].getshapes() ){
  if ( shape instanceof xslftextshape ){
  xslftextshape txtshape = (xslftextshape)shape ;
  system.out.println("txtshape" + (i+1) + ":" + txtshape.getshapename());
  system.out.println("text:" +txtshape.gettext());
  
  for ( xslftextparagraph textpara : txtshape.gettextparagraphs() ){
  list<xslftextrun> textrunlist = textpara.gettextruns();
  for(xslftextrun textrun: textrunlist) {
  textrun.setfontfamily("宋体");
  }
  }
  }
 }

完整代码如下（除了以上自己的解决方案，大部分是stackoverflow上的代码）：

public static void convertppttopdf(string sourcepath, string destinationpath, string filetype) throws exception {
 fileinputstream inputstream = new fileinputstream(sourcepath);
 double zoom = 2;
 affinetransform at = new affinetransform();
 at.settoscale(zoom, zoom);
 document pdfdocument = new document();
 pdfwriter pdfwriter = pdfwriter.getinstance(pdfdocument, new fileoutputstream(destinationpath));
 pdfptable table = new pdfptable(1);
 pdfwriter.open();
 pdfdocument.open();
 dimension pgsize = null;
 image slideimage = null;
 bufferedimage img = null;
 if (filetype.equalsignorecase(".ppt")) {
 slideshow ppt = new slideshow(inputstream);
 inputstream.close();
 pgsize = ppt.getpagesize();
 slide slide[] = ppt.getslides();
 pdfdocument.setpagesize(new rectangle((float) pgsize.getwidth(), (float) pgsize.getheight()));
 pdfwriter.open();
 pdfdocument.open();
 for (int i = 0; i < slide.length; i++) {
  
 textrun[] truns = slide[i].gettextruns(); 
 for ( int k=0;k<truns.length;k++){ 
  richtextrun[] rtruns = truns[k].getrichtextruns(); 
  for(int l=0;l<rtruns.length;l++){ 
//  int index = rtruns[l].getfontindex(); 
//  string name = rtruns[l].getfontname(); 
  rtruns[l].setfontindex(1); 
  rtruns[l].setfontname("宋体");  
  } 
 } 
  
  
 img = new bufferedimage((int) math.ceil(pgsize.width * zoom), (int) math.ceil(pgsize.height * zoom), bufferedimage.type_int_rgb);
 graphics2d graphics = img.creategraphics();
 graphics.settransform(at);
 
 graphics.setpaint(color.white);
 graphics.fill(new rectangle2d.float(0, 0, pgsize.width, pgsize.height));
 slide[i].draw(graphics);
 graphics.getpaint();
 slideimage = image.getinstance(img, null);
 table.addcell(new pdfpcell(slideimage, true));
 }
 }
 if (filetype.equalsignorecase(".pptx")) {
 xmlslideshow ppt = new xmlslideshow(inputstream);
 pgsize = ppt.getpagesize();
 xslfslide slide[] = ppt.getslides();
 pdfdocument.setpagesize(new rectangle((float) pgsize.getwidth(), (float) pgsize.getheight()));
 pdfwriter.open();
 pdfdocument.open();
 
 
 for (int i = 0; i < slide.length; i++) {
 for( xslfshape shape : slide[i].getshapes() ){
  if ( shape instanceof xslftextshape ){
  xslftextshape txtshape = (xslftextshape)shape ;
  // system.out.println("txtshape" + (i+1) + ":" + txtshape.getshapename());
  //system.out.println("text:" +txtshape.gettext());
  
  for ( xslftextparagraph textpara : txtshape.gettextparagraphs() ){
  list<xslftextrun> textrunlist = textpara.gettextruns();
  for(xslftextrun textrun: textrunlist) {
  textrun.setfontfamily("宋体");
  }
  }
  }
 }
 img = new bufferedimage((int) math.ceil(pgsize.width * zoom), (int) math.ceil(pgsize.height * zoom), bufferedimage.type_int_rgb);
 graphics2d graphics = img.creategraphics();
 graphics.settransform(at);
 graphics.setpaint(color.white);
 graphics.fill(new rectangle2d.float(0, 0, pgsize.width, pgsize.height));
 slide[i].draw(graphics);
  
  
// fileoutputstream out = new fileoutputstream("src/main/resources/test"+i+".jpg"); 
// javax.imageio.imageio.write(img, "jpg", out);
  
  
  
 graphics.getpaint();
 slideimage = image.getinstance(img, null);
 table.addcell(new pdfpcell(slideimage, true));
 }
 }
 pdfdocument.add(table);
 pdfdocument.close();
 pdfwriter.close();
 system.out.println("powerpoint file converted to pdf successfully");
 }

maven配置:

<dependency>
 <groupid>org.apache.poi</groupid>
 <artifactid>poi</artifactid>
 <!-- <version>3.13</version> -->
 <version>3.9</version>
 </dependency>
 <dependency>
 <groupid>org.apache.poi</groupid>
 <artifactid>poi-ooxml</artifactid>
 <!-- <version>3.10-final</version> -->
 <version>3.9</version>
 </dependency>
 
 <dependency>
 <groupid>com.itextpdf</groupid>
 <artifactid>itextpdf</artifactid>
 <version>5.5.7</version>
 </dependency>
 
 <dependency>
 <groupid>com.itextpdf.tool</groupid>
 <artifactid>xmlworker</artifactid>
 <version>5.5.7</version>
 </dependency>
 <dependency>
 <groupid>org.apache.poi</groupid>
 <artifactid>poi-scratchpad</artifactid>
 <!-- <version>3.12</version> -->
 <version>3.9</version>
 </dependency>

上面就是为大家分享的java实现ppt转pdf出现中文乱码问题的解决方法，希望对大家的学习有所帮助。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

[SAP] abap——调用报表的运行结果

在一些情况下我们需要调用报表运行，获取运行的结果，用Submit来实现。例：接口根据iv_bukrs、iv_li... [阅读全文]
day05【JDBC入门】

今日内容JDBC基本概念快速入门对JDBC中各个接口和类详解1 JDBC1.1 概念Java DataBase ... [阅读全文]
Mybatis PersistenceException异常：Error building SqlSession The error may exist in SQL Mapper Configur

初学mybatis出现了这个异常：org.apache.ibatis.exceptions.Persistenc... [阅读全文]
mybatis多表外键查询

<?xml version="1.0" encoding="UTF-8" ?><!DOCTYP... [阅读全文]
Java实现MongoDB的简单操作

package test;import java.util.*;import org.bson.Document... [阅读全文]
一头扎进Mybatis_学习笔记

第一讲问候MyBatis他大爷一.简介MyBatis是持久层的ORM框架，文中用到的版本是MyBatis3.二... [阅读全文]
SpringMybatis 分页读取数据库数据

1.ORACLE SQL select * from table where xxx order by xxxx... [阅读全文]
Python操作 MySQL数据库的步骤

别的不说，直接上代码MySQL 建表建表的时候，遇到一些坑，没有解决，如修改 MySQL 的默认引擎，defau... [阅读全文]
工程中类设计技巧

应用这些技巧可以使得设计出来的类更具有OOP的专业水准。1.一定要保证数据私有绝对不要破坏封装性。有时候，需要编... [阅读全文]
MyBatis——动态SQL语句——if标签和where标签复合使用

功能需求根据性别和名字查询用户官方文档MyBatis——动态 SQLSQL语句SELECT id, userna... [阅读全文]

网友评论


验证码：

java实现PPT转PDF出现中文乱码问题的解决方法

2019年07月22日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论