-
Notifications
You must be signed in to change notification settings - Fork 7.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
在进行文本检测、识别串联推理时,出现错误 #250
Comments
应该是因为预测模型使用的是中文模型,解码时指定了英文的字符解码方式。请问您使用的是哪一个识别模型呢? |
您好!我使用的识别模型是rcnn发自我的华为手机-------- 原始邮件 --------发件人: xiaoting <[email protected]>日期: 2020年6月22日周一 下午1:27收件人: PaddlePaddle/PaddleOCR <[email protected]>抄送: "[email protected]" <[email protected]>, Author <[email protected]>主 题: Re: [PaddlePaddle/PaddleOCR] 在进行文本检测、识别串联推理时,出现错误 (#250)
应该是因为预测模型使用的是中文模型,解码时指定了英文的字符解码方式。请问您使用的是哪一个识别模型呢?
—You are receiving this because you authored the thread.Reply to this email directly, view it on GitHub, or unsubscribe.
|
是中文模型吗?请试试预测时重新指定下解码方式: |
python3 tools/infer/predict_system.py --image_dir=./doc/imgs/img_9.jpg --det_model_dir="./inference/det_db/" --rec_model_dir="./inference/rec_crnn/" --rec_char_type='ch' |
打印下解码时的字典个数和预测的idx看一下呢? PaddleOCR/ppocr/utils/character.py Line 81 in f051be8
在81行后:print(char_num) PaddleOCR/ppocr/utils/character.py Line 96 in f051be8
96行前:print("text_index:{}, idx:{}".format(text_index,idx)) |
char_num: 6623 |
inference model 是从官方下载的吗?看起来预测结果有误,中文dict共有6623类,但是预测出了索引值都在8w+ |
我是自己训练的模型然后按照文档里的说明转换成的inference model! |
谢谢您的耐心解答,我还有个问题。同一张图片,为什么我单独进行检测的时候能正常检测出文字,而在进行文本检测、识别串联的时候连最基本的检测都检测不出来? |
您的图片是什么样子的呢,方便发一张样图给我们看下吗?
是指没有检测结果,还是检测结果错误呢 |
可能是因为识别得分低于0.5,置信度过低没有返回结果。可以把这个地方的阈值设置为0.0 看是否能显示出结果: PaddleOCR/tools/infer/predict_system.py Line 139 in f051be8
|
改了之后报错啦: |
你是只测试识别模型?imgs_words/ch下的是识别数据,高度太小。测试检测用/doc/imgs下的图像试试?? |
测试的是检测和识别串联推理,我用的测试命令如下: 测试的图片是我自己收集的数据集,图片大小为608*608 报错信息为: |
报错说明返回了检测框,在画图了。这好像是Pillow库的bug,可能因为您的字典中有特殊字符?可以参考这个issue尝试重新安装编译:python-pillow/Pillow#3066 或者跳过draw_text函数: draw_txt=False PaddleOCR/tools/infer/utility.py Line 311 in f051be8
返回结果可以通过修改阈值,在终端打印出来,score>=0.0 : PaddleOCR/tools/infer/predict_system.py Line 127 in f051be8
|
谢谢您的耐心解答~!我的问题解决了。 |
输入以下命令:
python3 tools/infer/predict_system.py --image_dir=/home/hs/OCR_Projects/PaddleOCR/train_data/tibetan/text_localization/test_image/img_9.jpg --det_model_dir="./inference/det_db/" --rec_model_dir="./inference/rec_crnn/"
出现以下错误:
Traceback (most recent call last):
File "tools/infer/predict_system.py", line 118, in
dt_boxes, rec_res = text_sys(img)
File "tools/infer/predict_system.py", line 81, in call
rec_res, elapse = self.text_recognizer(img_crop_list)
File "/home/hs/OCR_Projects/PaddleOCR/tools/infer/predict_rec.py", line 101, in call
preds_text = self.char_ops.decode(rec_idx_tmp)
File "tools/infer/../../ppocr/utils/character.py", line 97, in decode
char_list.append(self.character[text_index[idx]])
IndexError: list index out of range
The text was updated successfully, but these errors were encountered: