System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 医疗病例的命名实体识别方法、装置、设备及介质制造方法及图纸_技高网

医疗病例的命名实体识别方法、装置、设备及介质制造方法及图纸

技术编号:40560220 阅读:7 留言:0更新日期:2024-03-05 19:22
本发明专利技术涉及人工智能技术领域,尤其涉及一种医疗病例的命名实体识别方法、装置、设备及介质。获取在医疗病例中抽取的待识别文本,确定待识别文本中实体对应的实体列表,实体列表包括每个实体的实体名称与实体属性列表,实体属性列表包括属性类型与属性值,对每个实体的实体名称、属性类型与属性值进行编码处理,得到包含待识别文本上下文信息的编码结果,根据编码结果与待识别文。本申请中,提取短文本中的实体以及实体的属性类型与属性值,根据实体的属性类型与属性值将短文本编码为包含短文本的长文本,根据对应的长文本进行命名实体识别,将属性类型与属性值作为短文本的上下文,在基于上文识别的过程中,从而提高短文本的识别精度。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种医疗病例的命名实体识别方法、装置、设备及介质


技术介绍

1、命名实体识别技术是自然语言处理的重要领域之一,命名实体识别技术是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译、等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。

2、传统命名实体识别是基于实体词典来匹配文本中的命名实体,然而,面对不同的文本,实体识别的难易程度不同。例如,在医疗服务场景中,一般抽取电子病历中的短文本,对短文本进行命名实体识别,实现对电子病历的智能化理解,但在对于短文本进行命名实体识别时,由于短文本场景中上下文比较少,难以结合上下文来预测实体,使实体识别精度较低,因此,在短文本命名实体识别过程中,如何提高命名实体识别精度成为亟需解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种医疗病例的命名实体识别方法、装置、设备及介质,以解决在短文本命名实体识别过程中,命名实体识别精度较低的问题。

2、本申请实施例的第一方面提供了一种医疗病例的命名实体识别方法,所述命名实体识别方法包括:

3、获取在医疗病例中抽取的待识别文本,确定所述待识别文本中实体对应的实体列表,所述实体列表包括每个实体的实体名称与实体属性列表,所述实体属性列表包括属性类型与属性值;

4、对每个实体的所述实体名称、所述属性类型与所述属性值进行编码处理,得到包含所述待识别文本上下文信息的编码结果;

5、根据所述编码结果与所述待识别文本,对所述待识别文本进行命名实体识别,得到所述待识别文本的识别结果。

6、本申请实施例的第二方面提供了一种医疗病例的命名实体识别装置,所述命名实体识别装置包括:

7、获取模块,用于获取待识别文本,确定所述待识别文本中实体对应的实体列表,所述实体列表包括每个实体的实体名称与实体属性列表,所述实体属性列表包括属性类型与属性值;

8、编码模块,用于对每个实体的所述实体名称、所述属性类型与所述属性值进行编码处理,得到包含所述待识别文本上下文信息的编码结果;

9、识别模块,用于根据所述编码结果与所述待识别文本,对所述待识别文本进行命名实体识别,得到待识别文本的识别结果。

10、本申请实施例的第三方面提供了一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的医疗病例的命名实体识别方法。

11、本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的医疗病例的命名实体识别方法。

12、本专利技术与现有技术相比存在的有益效果是:

13、获取在医疗病例中抽取的待识别文本,确定待识别文本中实体对应的实体列表,实体列表包括每个实体的实体名称与实体属性列表,实体属性列表包括属性类型与属性值,对每个实体的实体名称、属性类型与属性值进行编码处理,得到包含待识别文本上下文信息的编码结果,根据编码结果与待识别文。本申请中,提取短文本中的实体以及实体的属性类型与属性值,根据实体的属性类型与属性值将短文本编码为包含短文本的长文本,根据对应的长文本进行命名实体识别,将属性类型与属性值作为短文本的上下文,在基于上文识别的过程中,从而提高短文本的识别精度。

本文档来自技高网...

【技术保护点】

1.一种医疗病例的命名实体识别方法,其特征在于,所述命名实体识别方法包括:

2.如权利要求1所述的命名实体识别方法,其特征在于,所述确定所述待识别文本中实体对应的实体列表,包括:

3.如权利要求1所述的命名实体识别方法,其特征在于,所述对每个实体的所述实体名称、所述属性类型与所述属性值进行编码处理,得到包含所述待识别文本上下文信息的编码结果,包括:

4.如权利要求3所述的命名实体识别方法,其特征在于,所述将每个实体对应的实体名称、所有属性类型、所有属性值进行拼接,得到拼接结果,包括:

5.如权利要求1所述的命名实体识别方法,其特征在于,所述根据所述编码结果与所述待识别文本,对所述待识别文本进行命名实体识别,得到待识别文本的识别结果,包括:

6.如权利要求5所述的命名实体识别方法,其特征在于,所述对所述语义编码特征进行预测分类,得到所述待识别文本的预测标签,包括:

7.一种医疗病例的命名实体识别装置,其特征在于,所述命名实体识别装置包括:

8.如权利要求7所述的命名实体识别装置,其特征在于,所述获取模块包括:

9.一种终端设备,其特征在于,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的命名实体识别方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的命名实体识别方法。

...

【技术特征摘要】

1.一种医疗病例的命名实体识别方法,其特征在于,所述命名实体识别方法包括:

2.如权利要求1所述的命名实体识别方法,其特征在于,所述确定所述待识别文本中实体对应的实体列表,包括:

3.如权利要求1所述的命名实体识别方法,其特征在于,所述对每个实体的所述实体名称、所述属性类型与所述属性值进行编码处理,得到包含所述待识别文本上下文信息的编码结果,包括:

4.如权利要求3所述的命名实体识别方法,其特征在于,所述将每个实体对应的实体名称、所有属性类型、所有属性值进行拼接,得到拼接结果,包括:

5.如权利要求1所述的命名实体识别方法,其特征在于,所述根据所述编码结果与所述待识别文本,对所述待识别文本进行命名实体识别,得到待识别文本的识别结果,包括:<...

【专利技术属性】
技术研发人员:陆凯
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1