System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置、计算机设备和存储介质制造方法及图纸_技高网

数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40841819 阅读:5 留言:0更新日期:2024-04-01 15:08
本申请涉及一种数据处理方法、装置、计算机设备、存储介质和程序产品。方法包括:获取待处理的医疗数据、医学知识数据和字段请求;将医疗数据、医学知识数据和字段请求输入至结构化处理网络中进行结构化处理,得到字段请求对应的结构化数据;结构化处理网络包括信息提取网络和大语言模型;信息提取网络用于在医疗数据中提取字段请求对应的相关文本。采用本方法能够对医疗文本数据进行有效的结构化处理。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种数据处理方法、装置、计算机设备、存储介质和程序产品。


技术介绍

1、随着医疗信息化技术的不断推进和医疗数据复杂度的不断增加,可以对医疗文本数据进行数据处理。其中,如何准确且高效地提取医疗文本数据中的各种信息,并将提取出的各种信息结构化为通用的文本数据,对于医疗数据的存储、检索、分析和应用均具有重要意义。

2、因此,如何对医疗文本数据进行有效的结构化处理,成为目前医疗领域亟待解决的技术问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够对医疗文本数据进行有效的结构化处理的数据处理方法、装置、计算机设备、存储介质和程序产品。

2、第一方面,本申请提供了一种数据处理方法,包括:

3、获取待处理的医疗数据、医学知识数据和字段请求;

4、将所述医疗数据、所述医学知识数据和所述字段请求输入至结构化处理网络中进行结构化处理,得到所述字段请求对应的结构化数据;所述结构化处理网络包括信息提取网络和大语言模型;所述信息提取网络用于在所述医疗数据中提取所述字段请求对应的相关文本。

5、在其中一个实施例中,所述信息提取网络包括文本嵌入子网络,所述将所述医疗数据、所述医学知识数据和所述字段请求输入至结构化处理网络中进行结构化处理,得到所述字段请求对应的结构化数据,包括:

6、将所述医疗数据、所述医学知识数据和所述字段请求输入至所述文本嵌入子网络,得到所述医疗数据对应的多个医疗数据向量、所述医学知识数据对应的多个医学知识向量和所述字段请求对应的请求向量;

7、根据所述多个医疗数据向量、所述多个医学知识向量和所述请求向量,确定所述字段请求对应的相关文本;

8、将所述字段请求对应的相关文本输入至所述大语言模型,得到所述字段请求对应的结构化数据。

9、在其中一个实施例中,所述信息提取网络还包括融合子网络,所述根据所述多个医疗数据向量、所述多个医学知识向量和所述请求向量,确定所述字段请求对应的相关文本,包括:

10、将所述多个医学知识向量和所述请求向量输入至所述融合子网络,得到目标融合向量;

11、根据所述目标融合向量和所述多个医疗数据向量,确定所述字段请求对应的相关文本。

12、在其中一个实施例中,所述将所述多个医学知识向量和所述请求向量输入至所述融合子网络,得到目标融合向量,包括:

13、将各所述医学知识向量和所述请求向量进行融合处理,得到各所述医学知识向量对应的初始融合向量;

14、在多个初始融合向量中选取一个初始融合向量作为所述目标融合向量。

15、在其中一个实施例中,所述在多个初始融合向量中选取一个初始融合向量作为所述目标融合向量,包括:

16、根据各所述初始融合向量的推理路径、各所述初始融合向量、各所述初始融合向量对应的医学知识向量、所述请求向量对应的字段请求,确定各所述初始融合向量的生成概率;

17、将所述多个初始融合向量中生成概率最大的初始融合向量,确定为所述目标融合向量。

18、在其中一个实施例中,所述根据所述目标融合向量和所述多个医疗数据向量,确定所述字段请求对应的相关文本,包括:

19、将与所述目标融合向量相似度最高的医疗数据向量确定为目标医疗数据向量;

20、根据目标医疗数据向量对应的医疗数据,确定所述相关文本。

21、在其中一个实施例中,所述文本嵌入子网络的训练方法,包括:

22、获取第一文本集合和第二文本集合;所述第一文本集合和所述第二文本集合之间的距离大于第一预设距离阈值;所述第一文本集合中包括多个文本对,所述文本对中的两两文本之间的距离小于第二预设距离阈值;

23、将所述第一文本集合和所述第二文本集合输入至初始文本嵌入模型进行训练,得到训练后的所述文本嵌入子网络。

24、第二方面,本申请还提供了一种数据处理装置,包括:

25、获取模块,用于获取待处理的医疗数据、医学知识数据和字段请求;

26、处理模块,用于将所述医疗数据、所述医学知识数据和所述字段请求输入至结构化处理网络中进行结构化处理,得到所述字段请求对应的结构化数据;所述结构化处理网络包括信息提取网络和大语言模型;所述信息提取网络用于在所述医疗数据中提取所述字段请求对应的相关文本。

27、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项实施例中的方法的步骤。

28、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

29、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

30、上述数据处理方法、装置、计算机设备、存储介质和程序产品,获取待处理的医疗数据、医学知识数据和字段请求;将医疗数据、医学知识数据和字段请求输入至结构化处理网络中进行结构化处理,得到字段请求对应的结构化数据;结构化处理网络包括信息提取网络和大语言模型;信息提取网络用于在医疗数据中提取字段请求对应的相关文本。本申请实施例可以预先获取专业的医学知识数据和字段请求,并根据待处理的医疗数据、专业的医学知识数据、字段请求和信息提取网络,从待处理的医疗数据中提取出相关文本,其中,该相关文本是采用专业的医学知识数据进行数据增强后的、且针对字段请求而生成的较准确的提示文本。从而,根据较准确的提示文本和大语言模型,能够利用大语言模型的语义理解能力对待处理的医疗数据进行结构化处理,得到字段请求对应的较准确的结构化数据。

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述信息提取网络包括文本嵌入子网络,所述将所述医疗数据、所述医学知识数据和所述字段请求输入至结构化处理网络中进行结构化处理,得到所述字段请求对应的结构化数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述信息提取网络还包括融合子网络,所述根据所述多个医疗数据向量、所述多个医学知识向量和所述请求向量,确定所述字段请求对应的相关文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述多个医学知识向量和所述请求向量输入至所述融合子网络,得到目标融合向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述在多个初始融合向量中选取一个初始融合向量作为所述目标融合向量,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述目标融合向量和所述多个医疗数据向量,确定所述字段请求对应的相关文本,包括:

7.根据权利要求2所述的方法,其特征在于,所述文本嵌入子网络的训练方法,包括:

8.一种数据处理装置,其特征在于,所述装置包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述信息提取网络包括文本嵌入子网络,所述将所述医疗数据、所述医学知识数据和所述字段请求输入至结构化处理网络中进行结构化处理,得到所述字段请求对应的结构化数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述信息提取网络还包括融合子网络,所述根据所述多个医疗数据向量、所述多个医学知识向量和所述请求向量,确定所述字段请求对应的相关文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述多个医学知识向量和所述请求向量输入至所述融合子网络,得到目标融合向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述在多个初始...

【专利技术属性】
技术研发人员:张晓衡乔治甄先通钱真
申请(专利权)人:北京联影智能影像技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1