完美解决java读取大文件内存溢出的问题_Java

完美解决java读取大文件内存溢出的问题

1. 传统方式：在内存中读取文件内容

读取文件行的标准方式是在内存中读取，guava 和apache commons io都提供了如下所示快速读取文件行的方法：

files.readlines(new file(path), charsets.utf_8); 
fileutils.readlines(new file(path));

实际上是使用bufferedreader或者其子类linenumberreader来读取的。

传统方式的问题： 是文件的所有行都被存放在内存中，当文件足够大时很快就会导致程序抛出outofmemoryerror 异常。

问题思考：我们通常不需要把文件的所有行一次性地放入内存中，相反，我们只需要遍历文件的每一行，然后做相应的处理，处理完之后把它扔掉。所以我们可以通过行迭代方式来读取，而不是把所有行都放在内存中。

2. 大文件读取处理方式

不重复读取与不耗尽内存的情况下处理大文件：

（1）文件流方式：使用java.util.scanner类扫描文件的内容，一行一行连续地读取

fileinputstream inputstream = null; 
scanner sc = null; 
try { 
 inputstream = new fileinputstream(path); 
 sc = new scanner(inputstream, utf-8); 
 while (sc.hasnextline()) {
  string line = sc.nextline(); 
  // system.out.println(line); 
  } 
}catch(ioexception e){
  logger.error(e);
}finally {
  if (inputstream != null) { 
  inputstream.close(); 
  } 
  if (sc != null) {
    sc.close();
   }
}

该方案将会遍历文件中的所有行，允许对每一行进行处理，而不保持对它的引用。总之没有把它们存放在内存中！

（2）apache commons io流：使用commons io库实现，利用该库提供的自定义lineiterator

lineiterator it = fileutils.lineiterator(thefile, utf-8); 
try {
 while (it.hasnext()) {
 string line = it.nextline(); 
 // do something with line 
  } 
} finally {
 lineiterator.closequietly(it);
}

该方案由于整个文件不是全部存放在内存中，这也就导致相当保守的内存消耗。

以上这篇完美解决java读取大文件内存溢出的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

Spring Security+Spring Data Jpa如何进行安全管理

为了操作简单，我这里引入 spring data jpa 来帮助我们完成数据库操作1.创建工程首先我们创建一个新的 spring boot 工程，添加如下依赖：... [阅读全文]

Mybatis Plus 字段为空值时执行更新方法未更新解决方案

问题描述系统测试过程中，同事测试出使用mybatis plus提供的封装方法updatebyid()时，字段从前台传入的数据为空值，但是执行方法后该字段未得到更... [阅读全文]

详解mybatis plus使用insert没有返回主键的处理

项目使用springboot搭建。最初的时候是使用mybatis，后来升级到mybatis plus。按照mp的官网介绍，使用mp的insert方法，对于自增的... [阅读全文]

mybatis-plus使用@EnumValue处理枚举类型的示例代码

自mybatis3.1.0开始，如果你无需使用原生枚举，可配置默认枚举来省略扫描通用枚举配置默认枚举配置1、配置文件配置枚举所在的包#配置枚举支持通配符 *... [阅读全文]

Java 解析XML数据的4种方式

解析的四种方式 dom 解析 sax 解析 jdom 解析 dom4j 解析案例实操dom 解析dom（document object model，... [阅读全文]

mybatis-plus生成mapper扩展文件的方法

阅读提示具有mybatis基础，熟练使用mybatis-plus。概述我们都知道，mybatis-plu... [阅读全文]

IDEA导入外部项目报Error:java: 无效的目标发行版: 11的解决方法

错误展示：information:java: errors occurred while compiling module 'employee-manageme... [阅读全文]

idea配置git及使用的方法详解

1. 配置git忽略文件idea有，eclipse，sts文件gitee有，github没有*配置git全局忽略文件*创建java.gitignore文件，\#... [阅读全文]

Java正则表达式如何匹配特定html标签内的内容

如题：使用正则表达式，怎么匹配特定html标签内的内容。比如，对于如下文本串：... ignored contentprefix content <htm... [阅读全文]

Java中Arrays的介绍及使用方法示例

arrays介绍java.util.arrays是一个与数组相关的工具类，里面提供了大量的静态的方法，用来实现数组常见的操作。public static str... [阅读全文]


验证码：

验证码：

完美解决java读取大文件内存溢出的问题

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论