System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种病历文本对应目标标识的获取系统技术方案_技高网

一种病历文本对应目标标识的获取系统技术方案

技术编号:42618232 阅读:26 留言:0更新日期:2024-09-03 18:24
本发明专利技术涉及一种病历文本对应目标标识的获取系统,所述系统包括样本文本列表和样本规则集、处理器和存储有计算机程序的存储器,其中,当计算机程序被处理器执行时,实现以下步骤:根据初始电子病历文本,获取初始电子病历文本对应的预设文本列表,获取第一候选规则集和第一指令信息集,将第一指令信息集输入至规则引擎中,获取第一目标标识集,获取第二候选规则集和第二指令信息集,将第二指令信息集输入至候选LLM模型中,获取第二目标标识集,从而获取初始电子病历文本对应的目标标识集,本发明专利技术将规则与LLM模型进行结合,提高了获取到目标标识的效率,根据输出结果调整不同类型指令信息对应的权重,使得获取到的目标标识的准确性较高。

【技术实现步骤摘要】

本专利技术涉及文本处理,特别是涉及一种病历文本对应目标标识的获取系统


技术介绍

1、随着医疗业务量的不断增长以及人工智能技术的不断发展,病历电子化已成为趋势,如何高效且准确地获取电子病历文本中的存在的问题成为热门研究方向,随着大语言模型在自然语言处理中的广泛应用,如何有效利用大语言模型且将大预言模型与其它方法相结合成为解决电子病历文本中的问题的重要方法。

2、现有技术中,获取电子病历文本的目标标识的方法为:获取电子病历文本,将电子病历文本处理成短文本,利用llm模型获取各个短文本中的关键词,基于获取到的关键词确定电子病历文本对应的标识。

3、综上,获取目标病历文本的方法存在的问题:局限于llm模型,使得获取到目标标识的效率较低,未对不同输出结果的权重进行调整,使得获取到的初始电子病历文本对应的目标标识的准确度较低。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为:一种病历文本对应目标标识的获取系统,系统包括:样本文本列表a={a1,……,ai,……,an}、a对应的样本规则集b={b1,……,bi,……,bn}、处理器和存储有计算机程序的存储器,其中,bi={b1i,b2i},ai为第i个样本文本,b1i为ai对应的第一样本规则列表,b2i为ai的第二样本规则列表,i=1……n,n为样本文本的数量,当计算机程序被处理器执行时,实现以下步骤:

2、s100,根据初始电子病历文本,获取初始电子病历文本对应的预设文本列表e={e1,……,er,……,es},er为第r个预设文本,r=1……s,s为预设文本的数量。

3、s200,根据e,获取e对应的第一候选规则集g={g1,……,gr,……,gs},gr为er对应的第一候选规则列表,其中,当er与ai一致时,获取gr=b1i。

4、s300,根据g,获取e对应的第一指令信息集m={m1,……,mr,……,ms},其中,mr为er对应的第一指令信息列表。

5、s400,将m输入至规则引擎中,获取第一目标标识集c={c1,……,cr,……,cs},其中,cr为mr对应的第一目标标识列表,所述第一目标标识列表包括若干个第一目标标识,所述第一目标标识为规则引擎基于第一指令信息进行筛选匹配获取到的对应的符号。

6、s500,根据e,获取e对应的第二候选规则集h={h1,……,hr,……,hs},hr为er对应的第二候选规则列表,其中,当er与ai一致时,获取hr=b2i。

7、s600,根据h,获取e对应的第二指令信息集n={n1,……,nr,……,ns},其中,nr为er对应的第二指令信息列表。

8、s700,将n输入至候选llm模型中,获取第二目标标识集d={d1,……,dr,……,ds},其中,dr为nr对应的第二目标标识列表,所述第二目标标识列表包括若干个第二目标标识,所述第二目标标识为基于第二指令信息列表中的第二指令信息获取到的候选llm模型的输出的符号。

9、s800,根据c和d,获取初始电子病历文本对应的目标标识集,其中,所述目标标识集包括若干个目标标识。

10、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种病历文本对应目标标识的获取系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:

11、一种病历文本对应目标标识的获取系统,所述系统包括预设数据库、处理器和存储有计算机程序的存储器,其中,所述预设数据库包括样本文本列表和样本文本列表对应的样本规则集,当计算机程序被处理器执行时,实现以下步骤:根据初始电子病历文本,获取初始电子病历文本对应的预设文本列表,根据预设文本列表,获取预设文本列表对应的第一候选规则集,根据第一候选规则集,获取预设文本列表对应的第一指令信息集,将第一指令信息集输入至规则引擎中,获取第一目标标识集,根据预设文本列表,获取预设文本列表对应的第二候选规则集,根据第二候选规则集,获取预设文本列表对应的第二指令信息集,将第二指令信息集输入至候选llm模型中,获取第二目标标识集,根据第一目标标识集和第二目标标标识集,获取初始电子病历文本对应的目标标识集,本专利技术基于知识图谱获取相应的规则,将规则与llm模型进行结合,提高了获取到目标标识的效率,基于输出结果的不同采用不同的方式获取目标标识,同时根据输出结果调整不同类型指令信息对应的权重,使得获取到的目标标识的准确性较高。

12、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种病历文本对应目标标识的获取系统,其特征在于,所述系统包括:样本文本列表A={A1,……,Ai,……,An}、A对应的样本规则集B={B1,……,Bi,……,Bn}、处理器和存储有计算机程序的存储器,其中,Bi={B1i,B2i},Ai为第i个样本文本,B1i为Ai对应的第一样本规则列表,B2i为Ai的第二样本规则列表,i=1……n,n为样本文本的数量,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述样本文本为基于样本电子病历信息集获取到的表征疾病相关问题的文本。

3.根据权利要求2所述的病历文本对应目标标识的获取系统,其特征在于,所述样本电子病历信息集包括若干个样本电子病历信息,所述样本电子病历信息为从数据库获取到的与疾病相关的信息。

4.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述第一样本规则列表包括若干个第一样本规则,其中,所述第一样本规则为基于候选知识图谱获取到的样本文本对应答案的选择依据。

5.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述第二样本规则列表包括若干个第二样本规则,其中,所述第二样本规则为基于与疾病相关的知识获取到的样本文本对应答案的判别依据。

6.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述初始电子病历文本包括若干个属性特征以及每个属性特征对应的文本。

7.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述规则引擎为基于不同的筛选维度进行规则匹配的组件。

8.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述候选LLM模型为调参后的LLM模型。

9.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,在S800中通过如下步骤获取目标标识:

10.根据权利要求9所述的病历文本对应目标标识的获取系统,其特征在于,在S805中还包括如下步骤:

...

【技术特征摘要】

1.一种病历文本对应目标标识的获取系统,其特征在于,所述系统包括:样本文本列表a={a1,……,ai,……,an}、a对应的样本规则集b={b1,……,bi,……,bn}、处理器和存储有计算机程序的存储器,其中,bi={b1i,b2i},ai为第i个样本文本,b1i为ai对应的第一样本规则列表,b2i为ai的第二样本规则列表,i=1……n,n为样本文本的数量,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述样本文本为基于样本电子病历信息集获取到的表征疾病相关问题的文本。

3.根据权利要求2所述的病历文本对应目标标识的获取系统,其特征在于,所述样本电子病历信息集包括若干个样本电子病历信息,所述样本电子病历信息为从数据库获取到的与疾病相关的信息。

4.根据权利要求1所述的病历文本对应目标标识的获取系统,其特征在于,所述第一样本规则列表包括若干个第一样本规则,其中,所述第一样本规则为...

【专利技术属性】
技术研发人员:刘立宇初乃强赵瑞莹
申请(专利权)人:奇点数联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1