当前位置：移动技术网 > IT编程>开发语言>Java > 解析Java的InputStream类并借助其读取ppt文件

解析Java的InputStream类并借助其读取ppt文件

2019年07月22日 | 移动技术网IT编程 | 我要评论

1. 关于inputstream.read()
在从数据流里读取数据时，为图简单，经常用inputstream.read()方法。这个方法是从流里每次只读取读取一个字节，效率会非常低。更好的方法是用inputstream.read(byte[] b)或者inputstream.read(byte[] b,int off,int len)方法，一次读取多个字节。

2. 关于inputstream类的available()方法
要一次读取多个字节时，经常用到inputstream.available()方法，这个方法可以在读写操作前先得知数据流里有多少个字节可以读取。需要注意的是，如果这个方法用在从本
地文件读取数据时，一般不会遇到问题，但如果是用于网络操作，就经常会遇到一些麻烦。比如，socket通讯时，对方明明发来了1000个字节，但是自己的程序调用available()方法却只得到900，或者100，甚至是0，感觉有点莫名其妙，怎么也找不到原因。其实，这是因为网络通讯往往是间断性的，一串字节往往分几批进行发送。本地程序调用available()方法有时得到0，这可能是对方还没有响应，也可能是对方已经响应了，但是数据还没有送达本地。对方发送了1000个字节给你，也许分成3批到达，这你就要调用3次available()方法才能将数据总数全部得到。
如果这样写代码：

 int count = in.available();
 byte[] b = new byte[count];
 in.read(b);

在进行网络操作时往往出错，因为你调用available()方法时，对发发送的数据可能还没有到达，你得到的count是0。
需要改成这样：

 int count = 0;
 while (count == 0) {
  count = in.available();
 }
 byte[] b = new byte[count];
 in.read(b);

3. 关于inputstream.read(byte[] b)和inputstream.read(byte[] b,int off,int len)

这两个方法都是用来从流里读取多个字节的，有经验的程序员就会发现，这两个方法经常读取不到自己想要读取的个数的字节。比如第一个方法，程序员往往希望程序能读取到b.length个字节，而实际情况是，系统往往读取不了这么多。仔细阅读java的api说明就发现了，这个方法并不保证能读取这么多个字节，它只能保证最多读取这么多个字节(最少1个)。因此，如果要让程序读取count个字节，最好用以下代码：

 byte[] b = new byte[count];
 int readcount = 0; // 已经成功读取的字节的个数
 while (readcount < count) {
  readcount += in.read(bytes, readcount, count - readcount);
 }

用这段代码可以保证读取count个字节，除非中途遇到io异常或者到了数据流的结尾(eofexception)

4.读取powerpoint文件的例子

import java.io.inputstream; 
 
import org.apache.lucene.document.document; 
import org.apache.poi.hslf.hslfslideshow; 
import org.apache.poi.hslf.model.textrun; 
import org.apache.poi.hslf.model.slide; 
import org.apache.poi.hslf.usermodel.slideshow; 
 
public document getdocument(index index, string url, string title, inputstream is) 
throws doccenterexception { 
 stringbuffer content = new stringbuffer(""); 
 try{ 
  slideshow ss = new slideshow(new hslfslideshow(is));//is 为文件的inputstream，建立slideshow 
  slide[] slides = ss.getslides();//获得每一张幻灯片 
  for(int i=0;i<slides.length;i++){ 
  textrun[] t = slides[i].gettextruns();//为了取得幻灯片的文字内容，建立textrun 
  for(int j=0;j<t.length;j++){ 
   content.append(t[j].gettext());//这里会将文字内容加到content中去 
  } 
  content.append(slides[i].gettitle()); 
  } 
  index.addindex(url, title, content.tostring()); 
 }catch(exception ex){ 
  system.out.println(ex.tostring()); 
 } 
 return null; 
}

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

leetcode101 对称二叉树-Java实现

给定一个二叉树，检查它是否是镜像对称的。例如，二叉树 [1,2,2,3,4,4,3] 是对称的。 1 ... [阅读全文]
【java基础】面试常见问题：类和对象，封装继承多态，final关键字，static关键字，类加载过程，双亲委派模型

类和对象1、谈谈你对java面向对象的理解答：《java编程思想》这一本书中写到，万物皆可对象。到底什么是面向对... [阅读全文]
JAVA 类和对象（入门级一看就懂）

JAVA 类和对象文章目录JAVA 类和对象概述1.1 类的定义1.2 类的组成实例2.1 对象的定义2.2 对... [阅读全文]
Java基础篇一

选一个自己喜欢的开发工具我这里先选择IDEA进行讲解，如需要下载MyEclipse的话我可以提供下载地址，或者直... [阅读全文]
常用的配置文件

web.xml最新版Servlet的配置文件：web.xml<?xml version="1.0" enc... [阅读全文]
fastdfs-client使用教程

FastDfs客户端使用文档fastdfs-client支持框架fastdfs-client目前支持的框架有sp... [阅读全文]
JAVA面向对象(二)

一、继承性1.继承性的好处：减少了代码的冗余，提高了代码的复用性；便于功能的拓展。class A extends... [阅读全文]
java导出生成word之XML方式

1. 简介Word从2003开始支持XML格式，操作流程先用office2003或者2007编辑好word的样式... [阅读全文]
【Spring】Bean的自动装配

自动装配是Spring满足bean依赖的一种方式！Spring会在上下文中自动寻找，并自动给bean装配属性！在... [阅读全文]
荐 Java语言基础之JDK1.8新特性（Lambda表达式、函数式接口、Stream流、新的日期API）

Java8概述是Java语言开发的一个主要版本。Oracle公司于2014年3月18日发布Java8版本。支持L... [阅读全文]

网友评论


验证码：

解析Java的InputStream类并借助其读取ppt文件

2019年07月22日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论