递归火山软件开发平台

标题: tesseract的问题 [打印本页]

作者: peeete    时间: 2024-7-13 06:25
标题: tesseract的问题
本帖最后由 peeete 于 2024-7-13 15:30 编辑

第一个问题:
自己尝试制作字库。根据教程 https://blog.csdn.net/qq_40147863/article/details/82285920 制作完成了..(不是发广告啊)
把制作完成的字库文件放在 tessdata 目录下了.如下图 红色的就是自己制作的字库
(, 下载次数: 27)
按照自带的例程.进行测试.识别出来的是乱码(图片中有英文+数字+中文)...按照我的理解.起码我自己制作的字库里面存在的几个中文应该是可以识别出来才对呀...为什么全是乱码?
后来想起来..例程中.有个类型是: OCR语言类型 ...他有且只有俩个属性:OCR语言类型.英文  和  OCR语言类型.简体中文.他们应该是对应chi_sim.traineddata 和 eng.traineddata 的..
问题来了..我自己制作的字库文件怎么在代码里面加载使用呢?









作者: 承易    时间: 2024-7-13 09:47
https://wwf.lanzouq.com/iav2n23tdxij  用这个 只是易语言的
作者: peeete    时间: 2024-7-13 14:30
承易 发表于 2024-7-13 09:47
https://wwf.lanzouq.com/iav2n23tdxij  用这个 只是易语言的

谢谢 ,但是WIN平台的不适合我.我需要的是安卓端
因为对识别时间要求很高.发送到服务器再- 识别 -再返回数据.往往时间不够了(基本都一秒以上了)




欢迎光临 递归火山软件开发平台 (https://bbs.voldp.com/) Powered by Discuz! X3.4