当前位置：移动技术网 > IT编程>开发语言>.net > 使用pdfbox实现pdf文本提取和合并功能示例

使用pdfbox实现pdf文本提取和合并功能示例

2017年12月12日 | 移动技术网IT编程 | 我要评论

有时我们需要对pdf文件进行一些处理，提取文本、合并等。以前我们使用a-pdf text extractor免费工具,为什么不自己写一个呢?
现在我们可以使用pdfbox-0.7.3这个开源类库. 下载解包后引用:

pdfbox-0.7.3.dll
ikvm.gnu.classpath.dll

新建一个项目,代码很简单:

复制代码代码如下:

public static string parsetotxtstringusingpdfbox(string filename){
pddocument doc = pddocument.load(filename);
pdftextstripper stripper = new pdftextstripper();
return stripper.gettext(doc);
}

获得这个textstring,再把它们写成磁盘文件就可以了, 像这样的方法:

复制代码代码如下:

public static void writetotextfile(string str,string txtpath)
{
if (string.isnullorempty(txtpath))
throw new argumentnullexception("output file path should not be null");
using (var txtwriter = new streamwriter(txtpath))
{
txtwriter.write(str);
txtwriter.close();
}
}

其它的功能您可以自行发挥了. 这个类库目前支持:

pdf to text extraction
merge pdf documents
pdf document encryption/decryption
lucene search engine integration
fill in form data fdf and xfdf
create a pdf from a text file
create images from pdf pages
print a pdf

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Openvas安装使用

OpenVAS的安装通过ISO镜像安装GSM管理系统下载镜像：https: / /www.greenbone.n... [阅读全文]
面试经历分享（一）

前言前面几天面试了几家公司，现在将面试的时候笔试题和面试的问题一并进行了整理，中间有些笔试题我忘记了，但是大部分... [阅读全文]
分享Sts授权直传阿里云OSS-.net core实现

前言磁盘怎么又满了？赶紧快打电话给运维扩容扩容扩容！这个问题已经是我入职新公司两个月来，第 3 次听到了。经... [阅读全文]
Fortify工具下载地址

Fortify是Micro Focus旗下AST （应用程序安全测试）产品，其产品组合包括：Fortify St... [阅读全文]
CNCF 新增两个孵化项目 | 云原生生态周报 Vol. 58

作者 | 丁海洋、孙健波业界要闻SUSE 计划收购 Rancher LabsSUSE 计划收购 RANCHER ... [阅读全文]
.NET MVC传值

五种常见的数据传递方式1，ViewBagC# 4.0引入，dynamic类型，object式的操作。dynami... [阅读全文]
赛题类型 Web、Crypto、Pwn、Reverse、Misc 各是指什么意思？

赛题类型 Web、Crypto、Pwn、Reverse、Misc 各是指什么意思？一般我们在参加一些”网络安全技... [阅读全文]
牛客编程巅峰赛S1第6场 - 青铜局 B题 - 牛牛爱奇数

Description在牛牛面前放着nn个数，这些数字既有奇数也有偶数，只不过牛牛对奇数情有独钟，他特别想让这些... [阅读全文]
CF243C Colorado Potato Beetle

一、题目 [阅读全文]
c# .net无限递归获取分类，传统for无限递归和 linq无限递归获取分类

c# .net无限递归获取分类，传统for无限递归和 linq无限递归获取分类 ... [阅读全文]

网友评论


验证码：

使用pdfbox实现pdf文本提取和合并功能示例

2017年12月12日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论