- 以下几个方向,每个都是比较独立的方向,但是却和OCR有着千丝万缕的关系,关于它们的资料就像散落在天空中的星星一般,散发着微弱的光芒,这里要做的就是将这些点点光芒聚集起来。
- 这里将会汇总出以下几个OCR周边项目的一些文档和资源,包括学术动态和一些工程化代码。
- 欢迎各位小伙伴提供PR。
- 相关论文和帖子:
- 相关工程:
- 数据集汇总:
- 相关论文和帖子:
- 相关工程:
- 数据集汇总:
- 英文表格识别数据集:
- PubTabNet: IBM构建,568k+文档图像数据,包括表格图像和对应的HTML标注。
- 英文表格识别数据集:
- 相关论文和帖子:
- 相关工程:
- video-subtitle-extractor: 一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件
- RapidVideOCR: 提取视频中硬字幕
- 数据集汇总:
- BOVText: A Large-Scale, Bilingual Open World Dataset for Video Text Spotting: 快手科技、浙江大学和北京邮电大学合作提出,大规模双语开放场景下的视频文本基准数据集,该数据集主要提供了2000+视频,1,750,000帧开放视频场景的视频。同时,还提供了丰富的标注类型(标题、字幕、场景文本等)。该数据集支持四个任务:视频帧检测、视频帧识别、视频文本跟踪和端到端视频文本识别。
- 相关论文和帖子:
- 相关工程:
- fake_certificate_generator: 假的证件合成器,包括身份证、驾驶证、营业执照。
- 数据集汇总:
- 暂无,一般这类数据较为敏感,通常都合成假数据来使用。
- 相关论文和帖子:
- 相关工程:
- 数据集汇总:
- 暂无