System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种医疗场景的命名实体识别方法、装置、设备及介质制造方法及图纸_技高网

一种医疗场景的命名实体识别方法、装置、设备及介质制造方法及图纸

技术编号:40078473 阅读:9 留言:0更新日期:2024-01-17 02:01
本发明专利技术涉及数字医疗领域,尤其涉及一种医疗场景的命名实体识别方法、装置、设备及介质,在用户上传待识别病历时,获取预设时间段内的历史病历,对每个历史病历进行实体识别,将实体的实体名称、实体类型和实体个数构成对应实体的实体信息;获取待识别病历中的目标句子,将目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体以及对应的实体信息序列;利用实体信息序列中的实体类型和实体个数,得到目标句子中每个实体的实际实体类型,从而得到目标句子中的命名实体结果,避免了有歧义的实体,提高了根据目标句子中每个实体的实际实体类型,得到的命名实体结果的准确性。

【技术实现步骤摘要】

本专利技术涉及数字医疗领域,尤其涉及一种医疗场景的命名实体识别方法、装置、设备及介质


技术介绍

1、命名实体是指某领域内具有固定意义或者代表性强的实体词,如新闻领域的事件名、地点名、人物名等。命名实体识别(named entity recognition,ner)是信息提取的一个子任务,是用于提取文本中的命名实体,并确定命名实体的实体类型的一种文本识别技术,该技术在自然语言处理技术走向实用化的过程中占有重要地位

2、目前,命名实体识别广泛应用于各个领域,通过对目标文本进行命名实体识别,从而提取到有效信息。例如,在数字医疗领域场景下,通常使用电子文档记录病人的相关信息以及疾病的各项表征数据,从而产生了大量的电子病历文本,进而通过命名实体识别提取电子病历文本中的有效消息,从而使医护人员能够更加方便快捷地进行医疗数据分析。但是由于同一实体有多种中文表述方法、同一表述方法的实体所对应的实际意义不同,以及实体间关联性强等问题增加了实体的识别难度。因此,如何命名实体提取的准确率成为亟待解决的问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种医疗场景的命名实体识别方法、装置、设备及介质,以解决命名实体提取的准确率低的问题。

2、第一方面,本专利技术实施例提供一种医疗场景的命名实体识别方法,所述命名实体识别方法包括:

3、在用户上传待识别病历时,获取预设时间段内的历史病历,对每个历史病历进行实体识别,得到n个实体和对应的实体类型;

4、针对任一实体类型,统计所述实体类型下表征相同含义的实体的实体个数,针对任一实体,将所述实体的实体名称、实体类型和实体个数构成对应所述实体的实体信息;

5、获取所述待识别病历中的目标句子,将所述目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体,将所述匹配的实体所对应的实体信息构成所述目标句子的实体信息序列;

6、利用所述实体信息序列中的实体类型和实体个数,对所述目标句子进行特征提取,得到特征提取结果,对所述特征提取结果进行分类,得到所述目标句子中每个实体的实际实体类型,根据所述目标句子中每个实体的实际实体类型,得到所述目标句子中的命名实体结果。

7、第二方面,本专利技术实施例提供一种医疗场景的命名实体识别装置,所述命名实体识别装置包括:

8、实体类型识别模块,用于在用户上传待识别病历时,获取预设时间段内的历史病历,对每个历史病历进行实体识别,得到n个实体和对应的实体类型;

9、实体信息统计模块,用于针对任一实体类型,统计所述实体类型下表征相同含义的实体的实体个数,针对任一实体,将所述实体的实体名称、实体类型和实体个数构成对应所述实体的实体信息;

10、实体信息匹配模块,用于获取所述待识别病历中的目标句子,将所述目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体,将所述匹配的实体所对应的实体信息构成所述目标句子的实体信息序列;

11、命名实体识别模块,用于利用所述实体信息序列中的实体类型和实体个数,对所述目标句子进行特征提取,得到特征提取结果,对所述特征提取结果进行分类,得到所述目标句子中每个实体的实际实体类型,根据所述目标句子中每个实体的实际实体类型,得到所述目标句子中的命名实体结果。

12、第三方面,本专利技术实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的命名实体识别方法。

13、第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的命名实体识别方法。

14、本专利技术实施例与现有技术相比存在的有益效果是:

15、本专利技术在用户上传待识别病历时,获取预设时间段内的历史病历,对每个历史病历进行实体识别,得到n个实体和对应的实体类型;针对任一实体类型,统计实体类型下表征相同含义的实体的实体个数,针对任一实体,将实体的实体名称、实体类型和实体个数构成对应实体的实体信息;获取待识别病历中的目标句子,将目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体,将匹配的实体所对应的实体信息构成目标句子的实体信息序列;利用实体信息序列中的实体类型和实体个数,对目标句子进行特征提取,得到特征提取结果,对特征提取结果进行分类,得到目标句子中每个实体的实际实体类型,根据目标句子中每个实体的实际实体类型,得到目标句子中的命名实体结果,通过识别历史简历中的每个实体的实体类型以及实体类型下表征相同含义的实体的实体个数,从而基于实体类型和实体个数,得到待识别简历中的目标句子中每个实体的实际实体类型,避免了有歧义的实体,从而提高了根据目标句子中每个实体的实际实体类型,得到的命名实体结果的准确性。

本文档来自技高网...

【技术保护点】

1.一种医疗场景的命名实体识别方法,其特征在于,所述命名实体识别方法包括:

2.根据权利要求1所述的命名实体识别方法,其特征在于,所述将所述目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体,包括:

3.根据权利要求2所述的命名实体识别方法,其特征在于,所述根据所述对比结果确认匹配的实体,包括:

4.根据权利要求1所述的命名实体识别方法,其特征在于,所述利用所述实体信息序列中包含的实体类型和实体个数,对所述目标句子进行特征提取,得到特征提取结果,对所述特征提取结果进行分类,得到所述目标句子中每个实体的实际实体类型,包括:

5.根据权利要求4所述的命名实体识别方法,其特征在于,所述获取训练好的实体识别模型,包括:

6.根据权利要求5所述的命名实体识别方法,其特征在于,所述编码器包括标记嵌入、位置嵌入和实体类型嵌入,则所述将所述训练样本输入所述编码器进行特征提取,输出得到样本嵌入向量,包括:

7.根据权利要求6所述的命名实体识别方法,其特征在于,所述实体类型向量的获取方法,包括:

8.一种医疗场景的命名实体识别装置,其特征在于,所述命名实体识别装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的命名实体识别方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的命名实体识别方法。

...

【技术特征摘要】

1.一种医疗场景的命名实体识别方法,其特征在于,所述命名实体识别方法包括:

2.根据权利要求1所述的命名实体识别方法,其特征在于,所述将所述目标句子与每个实体信息中的实体名称进行字符串匹配,得到匹配的实体,包括:

3.根据权利要求2所述的命名实体识别方法,其特征在于,所述根据所述对比结果确认匹配的实体,包括:

4.根据权利要求1所述的命名实体识别方法,其特征在于,所述利用所述实体信息序列中包含的实体类型和实体个数,对所述目标句子进行特征提取,得到特征提取结果,对所述特征提取结果进行分类,得到所述目标句子中每个实体的实际实体类型,包括:

5.根据权利要求4所述的命名实体识别方法,其特征在于,所述获取训练好的实体识别模型,包括:

6.根据权利要求5所述的命名实体...

【专利技术属性】
技术研发人员:陆凯
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1