一种信息抽取方法技术

技术编号:39899286 阅读:18 留言:0更新日期:2023-12-30 13:13
本申请公开了一种信息抽取方法

【技术实现步骤摘要】
一种信息抽取方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种信息抽取方法

装置

设备及存储介质


技术介绍

[0002]信息抽取是指从文本中提取出有价值的信息的过程

在医疗领域中,信息抽取具有重要应用,例如,从医学信息学的角度将医患之间的问诊信息进行抽取而得到的信息可以服务于医生诊疗

医疗产品推荐

患者标签服务

医疗科研分析等应用场景

[0003]但是,由于医疗领域具有特殊且严格的合规性要求,使得问诊信息的抽取精度要求较高

目前的问诊信息的抽取过程大多是采用关键字抽取或事件抽取的方式来实现

关键字抽取的方式难以捕捉到语义信息,导致准确性不足;而事件抽取的方式依赖于大量的事件样本标注,部署难度大


技术实现思路

[0004]本申请实施例提供了一种信息抽取方法

装置

...

【技术保护点】

【技术特征摘要】
1.
一种信息抽取方法,其特征在于,包括:基于实体抽取模型对问诊信息进行实体抽取,得到所述问诊信息中的预设类型的医学实体;基于确诊判断模型对所述问诊信息中具有所述医学实体的文本片段进行判断,得到所述文本片段对应的确诊判断结果;基于所述确诊判断结果,确定所述问诊信息对应的目标诊断结果;输出所述医学实体和所述目标诊断结果
。2.
根据权利要求1所述的信息抽取方法,其特征在于,所述确诊判断模型通过如下步骤训练:从所述问诊信息对应的训练样本中提取具有医学实体样本的目标文本片段,以及所述目标文本片段的上下文片段;基于所述目标文本片段和所述上下文片段进行确诊标注,得到确诊标注结果;所述确诊标注结果包括确诊

未确诊或无法确定;基于所述文本片段样本和所述确诊标注结果对初始分类模型进行训练,当满足训练截止条件时结束训练,得到所述确诊判断模型
。3.
根据权利要求1所述的信息抽取方法,其特征在于,所述问诊信息包括多个具有所述医学实体的文本片段;所述基于所述确诊判断结果,确定所述问诊信息对应的目标诊断结果,包括:当多个所述文本片段各自对应的确诊判断结果中存在确诊的确诊判断结果,将所述目标诊断结果确定为确诊;当多个所述文本片段各自对应的确诊结果中不存在确诊的确诊判断结果,将所述目标诊断结果确定为未确诊;当多个所述文本片段各自对应的确诊结果中存在无法确定的确诊判断结果,将所述目标诊断结果确定为无法确定
。4.
根据权利要求1至3任一项所述的信息抽取方法,其特征在于,所述目标诊断结果为确诊;所述方法还包括:基于亲属词库对所述问诊信息进行遍历搜索,得到遍历搜索结果;所述亲属词库包括多个预设亲属词;基于遍历搜索结果,确定所述目标诊断结果对应的患者和所述问诊信息对应的问诊人之间的身份关系;输出所述身份关系
。5.
根据权利要求4所述的信息抽取方法,其特征在于,所述基于遍历搜索结果,确定所述目标诊断结果对应的患者和所述问诊信息对应的问诊人之间的身份关系,包括:当所述遍历搜索结果表示所述具有医学实体的文本片段中存在所述预设亲属词,确定所述身份关系为所...

【专利技术属性】
技术研发人员:张晓璐
申请(专利权)人:重庆数智逻辑科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1