医疗实体信息抽取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38926235 阅读:11 留言:0更新日期:2023-09-25 09:33
本申请实施例属于人工智能以及数字医疗领域,涉及一种医疗实体信息抽取方法、装置、计算机设备及存储介质,方法包括:获取训练医疗文本;基于训练医疗文本,构建医疗实体信息抽取任务的训练样本集,医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,训练样本集的负样本中的医疗实体均来自训练医疗文本;根据训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;获取待处理医疗文本,并通过统一信息抽取模型对待处理医疗文本进行信息抽取,得到医疗实体信息。此外,本申请还涉及区块链技术,医疗实体信息可存储于区块链中

【技术实现步骤摘要】
医疗实体信息抽取方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能以及数字医疗
,尤其涉及一种医疗实体信息抽取方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,通过计算机实现自然语言处理已经变得非常广泛。实体信息抽取在自然语言处理中是一种重要的应用。例如,在医疗领域,通过模型从医疗病历文书中抽取疾病、症状、发生时间、持续时间等实体,有时还需要抽取到上述实体之间的关系,比如某个疾病的持续时间。抽取到的实体和实体关联关系作为实体信息,可以用于构建医疗知识图谱、医疗资源推荐以及医疗保险等应用场景,提取到的实体信息还可以作为医疗病历文书中的关键信息展示给医生,以便医生快速从医疗病历文书中找到核心信息,提高问诊效率。因此,医疗实体信息抽取具有重要的实用价值。
[0003]由于医疗病历文书的复杂性,医疗病历文书中会出现较多实体,实体之间的关系也较为复杂。当前的医疗实体信息抽取都是将实体抽取和关系抽取作为独立的任务去做,不同任务之间缺少信息交互,导致跨任务的效果非常差,对于原本不存在关系的实体,经常会忽略上下文语意并判断它们之间存在关系,导致医疗实体信息抽取的准确性较低。

技术实现思路

[0004]本申请实施例的目的在于提出一种医疗实体信息抽取方法、装置、计算机设备及存储介质,以解决医疗实体信息抽取准确性较低的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种医疗实体信息抽取方法,采用了如下所述的技术方案:
[0006]获取训练医疗文本;
[0007]基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集,所述医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,所述训练样本集的负样本中的医疗实体均来自所述训练医疗文本;
[0008]根据所述训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;
[0009]获取待处理医疗文本,并通过所述统一信息抽取模型对所述待处理医疗文本进行信息抽取,得到医疗实体信息。
[0010]为了解决上述技术问题,本申请实施例还提供一种医疗实体信息抽取装置,采用了如下所述的技术方案:
[0011]训练获取模块,用于获取训练医疗文本;
[0012]样本集构建模块,用于基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集,所述医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,所述训练样本集的负样本中的医疗实体均来自所述训练医疗文本;
[0013]模型训练模块,用于根据所述训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;
[0014]信息抽取模块,用于获取待处理医疗文本,并通过所述统一信息抽取模型对所述待处理医疗文本进行信息抽取,得到医疗实体信息。
[0015]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0016]获取训练医疗文本;
[0017]基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集,所述医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,所述训练样本集的负样本中的医疗实体均来自所述训练医疗文本;
[0018]根据所述训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;
[0019]获取待处理医疗文本,并通过所述统一信息抽取模型对所述待处理医疗文本进行信息抽取,得到医疗实体信息。
[0020]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
[0021]获取训练医疗文本;
[0022]基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集,所述医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,所述训练样本集的负样本中的医疗实体均来自所述训练医疗文本;
[0023]根据所述训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;
[0024]获取待处理医疗文本,并通过所述统一信息抽取模型对所述待处理医疗文本进行信息抽取,得到医疗实体信息。
[0025]与现有技术相比,本申请实施例主要有以下有益效果:基于训练医疗文本,构建医疗实体信息抽取任务的训练样本集,医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,训练样本集包含负样本,负样本中的医疗实体均来自训练医疗文本,以避免模型不考虑文本的上下文语意,而直接判断两个医疗实体之间存在实体关联关系,确保了训练得到的模型的准确性;根据训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型,统一信息抽取模型可以对不同的信息抽取任务进行统一建模,自适应生成目标结构,并从不同的语料中协同学习信息抽取的能力,可以提高信息抽取的准确性,提高模型训练效率;获取待处理医疗文本,并由统一信息抽取模型对待处理医疗文本进行信息抽取,提高了医疗实体信息抽取的准确性。
附图说明
[0026]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本申请可以应用于其中的示例性系统架构图;
[0028]图2是根据本申请的医疗实体信息抽取方法的一个实施例的流程图;
[0029]图3是根据本申请的医疗实体信息抽取装置的一个实施例的结构示意图;
[0030]图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
[0031]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0032]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0033]为了使本
的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0034]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗实体信息抽取方法,其特征在于,包括下述步骤:获取训练医疗文本;基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集,所述医疗实体信息抽取任务用于抽取文本中的医疗实体以及医疗实体间的实体关联关系,所述训练样本集的负样本中的医疗实体均来自所述训练医疗文本;根据所述训练样本集对初始统一信息抽取模型进行训练,得到统一信息抽取模型;获取待处理医疗文本,并通过所述统一信息抽取模型对所述待处理医疗文本进行信息抽取,得到医疗实体信息。2.根据权利要求1所述的医疗实体信息抽取方法,其特征在于,所述基于所述训练医疗文本,构建医疗实体信息抽取任务的训练样本集的步骤包括:获取医疗实体信息抽取任务的任务结构;根据所述任务结构确定至少一种任务提示类型;基于所述训练医疗文本,构建每种任务提示类型所对应的训练样本,并根据得到的训练样本生成所述医疗实体信息抽取任务的训练样本集。3.根据权利要求2所述的医疗实体信息抽取方法,其特征在于,当任务提示类型为关系提示类型,且构建的训练样本为正样本时,所述基于所述训练医疗文本,构建每种任务提示类型所对应的训练样本的步骤包括:在所述训练医疗文本中选取第一医疗实体和第二医疗实体,所述第一医疗实体和所述第二医疗实体存在实体关联关系;按照所述关系提示类型,根据选取到的第一医疗实体和第二医疗实体构建正样本。4.根据权利要求3所述的医疗实体信息抽取方法,其特征在于,当任务提示类型为所述关系提示类型,且构建的训练样本为负样本时,所述基于所述训练医疗文本,构建每种任务提示类型所对应的训练样本的步骤包括:在所述训练医疗文本中选取第三医疗实体,所述第三医疗实体不存在实体关联关系;按照所述关系提示类型,根据选取到的第三医疗实体构建负样本;或者,在所述训练医疗文本中选取第四医疗实体和第五医疗实体,所述第四医疗实体和所述第五医疗实体间不存在实体关联关系;按照所述关系提示类型,根据选取到的第四医疗实体和第五医疗实体构建负样本。5.根据权利要求2所述的医疗实体信息...

【专利技术属性】
技术研发人员:吴逗逗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1