递归火山软件开发平台

标题: 【问题咨询】如何载入PDF文档里面的字符到编辑框不乱码? [打印本页]

作者: 创新    时间: 2021-8-29 01:13
标题: 【问题咨询】如何载入PDF文档里面的字符到编辑框不乱码?
本帖最后由 创新 于 2021-9-1 18:33 编辑

如图,如何载入PDF文档里面的字符到编辑框不乱码?

补充:
        这不是要做阅读器软件。
        我只需要提取PDF里面的字符(包括回车符,换行符,制表符等),再用正则表达式提取所需内容,再写入到Excel。




作者: michardhl    时间: 2021-8-29 16:34
压根不是这么读的。要有支持库才行啊。
作者: 创新    时间: 2021-8-29 17:13
michardhl 发表于 2021-8-29 16:34
压根不是这么读的。要有支持库才行啊。

现在火山有没有支持该功能的支持库
作者: 创新    时间: 2021-8-29 17:25
michardhl 发表于 2021-8-29 16:34
压根不是这么读的。要有支持库才行啊。

我用   编辑框1.内容 = UTF8到文本 (文档字节集)  可以读到.txt文本的
作者: 小蜗牛    时间: 2021-8-29 17:34
PDF不是txt...
作者: 创新    时间: 2021-8-29 18:20
小蜗牛 发表于 2021-8-29 17:34
PDF不是txt...

帮忙看看有没有办法可以实现该功能
作者: b0y    时间: 2021-8-29 19:01
pdf需要解析的
作者: 创新    时间: 2021-8-29 20:16
b0y 发表于 2021-8-29 19:01
pdf需要解析的

可以帮忙给个样例吗
作者: lijianye    时间: 2021-8-30 08:51
在你没搞清楚PDF是什么之前,还是到网上下载一个“PDF阅读器”来读吧。
作者: 创新    时间: 2021-9-1 17:56
lijianye 发表于 2021-8-30 08:51
在你没搞清楚PDF是什么之前,还是到网上下载一个“PDF阅读器”来读吧。

我不是要做阅读器的。我只需要提取PDF里面的字符(包括回车,换行符,制表符等),再用正则表达式提取所需内容,再写入到Excel。
作者: sfz0316    时间: 2021-9-2 09:55
可以参考
https://blog.csdn.net/lifes_java/article/details/84858091

或者利用网页提交获取
https://pdf.wdku.net/pdftotext

作者: 唐兀    时间: 2022-3-9 22:43
创新 发表于 2021-9-1 17:56
我不是要做阅读器的。我只需要提取PDF里面的字符(包括回车,换行符,制表符等),再用正则表达式提取所需内 ...

我现在想PC上读取出PDF的字节集数据,怎么搞的,我用读入文件,读不出来,你怎么读的,兄弟




欢迎光临 递归火山软件开发平台 (https://bbs.voldp.com/) Powered by Discuz! X3.4