---------------------------------------------------OCRandQPTandIS---------------------------------------------------
Covid-19 outbreak information statistics
[疫情信息统计进阶篇]PPOCR和QPT的落地实战
项目地址:https://aistudio.baidu.com/aistudio/projectdetail/3877807
[PaddleOCR]核酸检测证明复查统计?50行代码轻松搞定
项目地址:https://aistudio.baidu.com/aistudio/projectdetail/3779297
继上篇说起,完成了ocr的核酸检测信息统计
这次主要来搞搞,如何落地实践。
项目已经放置数据集中,开箱即可使用,因为设计界面制作,请您在本地环境使用。
截图展示:
B站视频地址: https://www.bilibili.com/video/BV1Hr4y1J7cR
!unzip -oq /home/aistudio/data/data141663/OcrYq.zip -d work/
- 将整个项目下载到本地之后,安装
requirement.txt 中的所有依赖,可能不全,自己看情况导入
- 运行 run.py 本地项目预览
正常这已经可以了
- 运行pkg.py 打包工具
运行之后既可在文件夹中发现out目录,根据QPT的描述进行使用即可。
- 首先认准官方链接不迷路:
- 找到README.MD中的快速使用(戳他)
QPT-快速使用 这里我们可以看到,QPT提供了两种打包方式,撰写打包脚本(推荐)和使用命令打包
- 推荐的是打包脚本,那咱们就直接用脚本,直接按照流程开搞 实现的脚本可见项目源码中的
pkg.py
# 导入QPT
from qpt.executor import CreateExecutableModule as CEM
from qpt.modules.python_env import Python38
def main():
module = CEM(work_dir="F:/OcrYq",
launcher_py_path="F:/OcrYq/run.py",
save_path="./out",
requirements_file="auto",
hidden_terminal=False,
interpreter_module=Python38(),
icon="F:/OcrYq/static/favicon.ico")
# 开始打包
module.make()
if __name__ == "__main__":
main()
PS:
- 就没见过这么详细的注释好吧?不管是代码的注释以及运行过程中的输出,为了小白使用操碎了心,何况还有GT这位随时的答疑机器人[手动狗头]
- 其中:官方的python解释器是python37的,可以根据你自己的版本进行更换,这个也就改个数的问题,洒洒水就解决了。
- 运行之后,可以看到
没错,就是这个out文件夹,里面就会出现两个文件夹
实现:
- 首先,肯定是ocr检测的实现,这个直接使用PPOCR的接口即可,但没有采用GPU,方便打包用户使用。
- 对于检测得到的文本,有针对性的根据数据的特点去保存,但无法做到普适所有的疫情信息图片,这点是缺点。
- 界面的编写,这里采用PyQt5进行实现,QT designer的界面化使得开发简单了许多,只需要合理使用信号与槽即可完成代码编写。
- 对于界面的未响应,使用多线程来解决线程的阻塞,进而增加一点用户体验。
提升:
- 由于仅仅花费了几天的时间自学PyQT,界面还需要优化,提升用户体验。
- OCR没有进行训练,只是采用的接口快速实现,会存在识别不准的情况,但目前来看相对还好。
- 界面中应该有进度提示,或者是文本流动,增加用户感观体验。
- 没有采用GPU,很慢,识别起来很慢,200张图片需要15分钟。
后续
换成paddlepadle-gpu 之后,两百张图片大概50秒
帮助&资助
本人可以提供私人订制服务,类似的OCR小工具,都可以具体私聊我制作,可以在issue中提交申请,我会查看,友情资助二维码如下:(谢谢)
全网同名:
iterhui
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/643467