peeete 发表于 2024-7-13 06:25:07

tesseract的问题

本帖最后由 peeete 于 2024-7-13 15:30 编辑

第一个问题:
自己尝试制作字库。根据教程 https://blog.csdn.net/qq_40147863/article/details/82285920 制作完成了..(不是发广告啊)
把制作完成的字库文件放在 tessdata 目录下了.如下图 红色的就是自己制作的字库

按照自带的例程.进行测试.识别出来的是乱码(图片中有英文+数字+中文)...按照我的理解.起码我自己制作的字库里面存在的几个中文应该是可以识别出来才对呀...为什么全是乱码?
后来想起来..例程中.有个类型是: OCR语言类型 ...他有且只有俩个属性:OCR语言类型.英文和OCR语言类型.简体中文.他们应该是对应chi_sim.traineddata 和 eng.traineddata 的..
问题来了..我自己制作的字库文件怎么在代码里面加载使用呢?








承易 发表于 2024-7-13 09:47:42

https://wwf.lanzouq.com/iav2n23tdxij用这个 只是易语言的

peeete 发表于 2024-7-13 14:30:56

承易 发表于 2024-7-13 09:47
https://wwf.lanzouq.com/iav2n23tdxij用这个 只是易语言的

谢谢 ,但是WIN平台的不适合我.我需要的是安卓端
因为对识别时间要求很高.发送到服务器再- 识别 -再返回数据.往往时间不够了(基本都一秒以上了)
页: [1]
查看完整版本: tesseract的问题