关于UIE信息抽取,你遇到了什么难题、还有哪些需求?欢迎反馈。也欢迎分享实践经验! #3316
Replies: 29 comments 20 replies
-
UIE FAQSchema、Prompt相关
训练
部署及加速
标注工具
UIE Pretrain
其它
|
Beta Was this translation helpful? Give feedback.
-
UIE是否未来有支持小语种的可能性(日语,韩语,泰语,法语等) |
Beta Was this translation helpful? Give feedback.
-
希望在蒸馏版本基础上,后续也支持量化、剪枝、NAS等方案,以及cpu多核多进程处理,多卡推理部署 |
Beta Was this translation helpful? Give feedback.
-
优化一下UIE关系抽取evaluate.py输出 #3224 |
Beta Was this translation helpful? Give feedback.
-
UIE有没有针对指代消解的设计?如果没有、需要额外预处理,有没有最佳实践? |
Beta Was this translation helpful? Give feedback.
-
UIE预训练对多实体效果不佳,是否在预训练中多实体语料稀少导致的?有计划改进吗? @chenxiaozeng |
Beta Was this translation helpful? Give feedback.
-
UIE抽取英文信息的时候,比如一个长的地址,中间所有的空格都被删除了,出来就是一团字符,因为中文是没有空格的,但是英文是依赖空格去分词的,能否检测到如果是英文,就不用去除中间的空格呢?@chenxiaozeng |
Beta Was this translation helpful? Give feedback.
-
uie-sent-base语句级情感分类任务,能否支持: 正向、负向、中性,三种分类? |
Beta Was this translation helpful? Give feedback.
-
请问有没有可能批量进行schema不同的实体抽取呢? |
Beta Was this translation helpful? Give feedback.
-
【FAQ】你好,我用的是finetune.py对模型进行微调,为什么在./checkpoint/model_best下只有运行日志vdlrecords.1677479107.log,没有模型信息,训练好的模型数据不是在output_dir 里吗? |
Beta Was this translation helpful? Give feedback.
-
【FAQ】你好,我用的是finetune.py对模型进行微调,使用cpu运行后能正常生成模型,但是使用gpu后模型无法生成,仅生成运行日志。 这是运行使用参数 [2023-04-24 10:57:49,104] [ INFO] - All the weights of UIE were initialized from the model checkpoint at uie-base. |
Beta Was this translation helpful? Give feedback.
-
有大佬知道为什么用官方文档的命令在pycharm中运行只能得到.log文件,其他的模型文件没有得到吗? |
Beta Was this translation helpful? Give feedback.
-
你好,在做实体抽取的时候可以同时输出预测的概率吗 |
Beta Was this translation helpful? Give feedback.
-
环境为: 问题描述:在合同文本中抽取关系,合同文本长度有几千到一万字不等,由于有的关系涉及到的实体间隔比较远(该情况概率较小),在标注的时候是将整篇合同文本放进去进行标注的。在第一版的时候通过实体关系标注抽取的时候召回率和f1都有0.85左右,在第二版新增了实体种类和关系种类的时候,召回率为0.3,f1为0.4,较第一版差距比较大。同时,两版抽取schema中相同的实体和关系,第二版的效果也要远低于第一版的,不知道是不是被第二版标注的其他数据给影响到了整个的效果。 eg:全部合同文本涉及到多个类别,共有700份文件进行了标注,其中各类别分布不均匀,有的类别有100多个样本,有的类别是由10多个样本,但是部分样本在100的类别抽取效果也很不好。为了验证我尝试过将该类别样本单独提取出来做训练和推理,发现仅有该类别的情况下仍然效果不好。 |
Beta Was this translation helpful? Give feedback.
-
我想请问一下,我的事件抽取 schema = {"发布政策触发词": ["时间", "地点", "发布者", "政策内容"]}是这样的,最后抽取的结果中,触发词是 “发布声明。此轮制我包括六个方面,第一项是欧盟将对来自俄罗斯的每年价值48亿欧元的煤炭实施进口禁令”。就是会是一个长句子,会在正常的触发词后面在多抽取一句话。为什么会这样呢 |
Beta Was this translation helpful? Give feedback.
-
我如果想修改分词方式应该在哪里修改呢请问,因为我的数据标注后预测只有百分之74现在,调参后的最高就是准确率74但是F180,想从分词等方面进行优化,我应该在哪里写入代码? |
Beta Was this translation helpful? Give feedback.
-
您好,我想为一下在进行信息抽取时,我的文本是:患者意识清楚,伴头晕乏力,无胸闷胸痛,无畏寒发热,无咳嗽咳痰等不适,急诊完善血常规。 |
Beta Was this translation helpful? Give feedback.
-
您好,我使用information_extraction进行实体抽取,使用的cpu,使用base的话一条出结果差不多要2s左右,tiny每条平均1s左右,请问要怎么设置才能提升推理速度 |
Beta Was this translation helpful? Give feedback.
-
推理速度问题 , 我微调后进行uiex 的推理, 一张4M的图片推理在 4~8s之间, 使用的是GPU , 也需要进行推理加速 |
Beta Was this translation helpful? Give feedback.
-
在终端运行“python doccano.py |
Beta Was this translation helpful? Give feedback.
-
[FAQ]我在进行模型蒸馏的时候, python evaluate_teacher.py python train.py |
Beta Was this translation helpful? Give feedback.
-
为什么schema中输入行为、动作之类的都抽取不出来实体?这个设置的范围是否比较小呢? |
Beta Was this translation helpful? Give feedback.
-
我想从化学文献中提取化合物名称和性质数据,但用UIE提取的效果不如文心大模型,甚至训练、微调了UIE模型,但提取效果仍赶不上文心大模型。问题出在哪里?是我训练的数据量不够大(10篇文章)?如果提取效果连文心大模型都赶不上,那UIE存在的意义是什么?? |
Beta Was this translation helpful? Give feedback.
-
uie微调之后和文心大模型差距有多少,比如测试集上的F1-score等指标,差多少? |
Beta Was this translation helpful? Give feedback.
-
请问训练时中断了再训练如何从中断的地方开始? |
Beta Was this translation helpful? Give feedback.
-
训练很慢正常吗,四张卡20个epoch跑了十个小时 |
Beta Was this translation helpful? Give feedback.
-
UIE抽取不连续实体怎么转换成关系抽取任务 |
Beta Was this translation helpful? Give feedback.
-
uie英文只给512个字符是否太少了,有什么方法能够进行长文本关系提取 |
Beta Was this translation helpful? Give feedback.
-
PaddleNLP发布通用信息抽取技术UIE后,收到众多用户的积极反馈。欢迎各位提出在信息抽取场景下面临的各种问题,在此讨论当中将会有来自诸多专业团队的人员的讨论和回复,也欢迎各位参与此讨论当中来。特开此贴:
大家可按照以下格式来发起讨论topic:
FAQ/Feature/Others
详细说明
Beta Was this translation helpful? Give feedback.
All reactions