PDFBox
pdfbox是一个bsd许可下的的源码开放项目,它是可以处理pdf文档的java工具,pdfbox支持提取文本,可提取unicode字符的内容,支持加密/解密pdf文档,可以从pdf和xfdf格式中导入或导出表单数据。功能介绍
1、文本提取:从pdf文档中提取文本。
2、合并&分割:可以把多个pdf文档合并成单个,也可以把单个pdf分拆成多个pdf文档。
3、表单填充:可以从pdf表单中提取数据,或者是填充pdf表单。
4、pdf/a验证:验证pdf文档是否满足pdf/a iso标准。
5、pdf打印:把pdf文档输出到打印机——利用了java的打印api。
6、pdf转换:可以把pdf文档转换成映像文件。
7、pdf创建:可以从头创建新的pdf文档。
8、集成lucene搜索引擎:lucene搜索引擎与pdf索引相集成。
更新日志
这个版本是基于 2.0.5 版本的增量式 bug 修复版本,包含了几个修复和小改进,更新如下:
bug 修复
[pdfbox-3313] - java 9 inaccessibleobjectexception
[pdfbox-3318] - illegalargumentexception in pdpagetree constructor: root cannot be null
[pdfbox-3347] - cosname parsing doesn't handle iso-8859-1 encoded bytes
软件资讯2017-01-17
软件资讯2016-12-09
软件资讯2016-10-26
软件资讯2016-10-06