- 👋 Hi, I’m @tianchiguaixia
- 👀 I’m interested in python,NLP
- 🌱 I’m currently learning NLP
- 💞️ I’m looking to collaborate on NLP
- 📫 How to reach me:[email protected]
Pinned Loading
-
layoutlmv3-chinese
layoutlmv3-chinese Public该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作
-
text_classification
text_classification Public该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit
Python 18
-
medical_ocr_streamlit
medical_ocr_streamlit Public该项目主要是为了识别图片里面的表格数据,并将表格数据抽取处理,导出成csv的文件。整个项目会使用streamlit进行部署和展示。使用的技术:paddleocr,PPStructure,streamlit
-
medical_records_extract
medical_records_extract Public该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件
-
qwen1.5-ner
qwen1.5-ner Public使用Qwen1.5-0.5B-Chat模型进行通用信息抽取任务的微调,旨在: 验证生成式方法相较于抽取式NER的效果; 为新手提供简易的模型微调流程,尽量减少代码量; 大模型训练的数据格式处理。
Python 9
Something went wrong, please refresh the page to try again.
If the problem persists, check the GitHub status page or contact support.
If the problem persists, check the GitHub status page or contact support.