System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据映射关系判断方法、系统以及相关装置制造方法及图纸_技高网

一种数据映射关系判断方法、系统以及相关装置制造方法及图纸

技术编号:41085377 阅读:2 留言:0更新日期:2024-04-25 13:47
本申请公开了一种数据映射关系判断方法、系统以及相关装置,该方法包括:获取待判断数据,基于待判断数据,确定询问文本;其中,待判断数据包含原始数据和候选标准数据;将询问文本输入微调后的智能分析模型中,以得到表征原始数据和候选标准数据是否符合预设映射关系的判断结果;其中,智能分析模型是基于多个正样本和多个负样本进行微调得到的,正样本中包含原始训练数据以及匹配的标准训练数据,负样本是基于至少部分正样本中的原始训练数据与标准数据集中各个参考标准数据的相似度确定的,相似度与对应的原始训练数据和参考标准数据分别包含的元素相关。通过上述方式,本申请能够提高对不同数据之间的映射关系进行判断的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别是涉及一种数据映射关系判断方法、系统以及相关装置


技术介绍

1、在医疗领域中,由于不同医疗机构或医生等使用的医学术语存在差异,往往容易导致多个不同的医学术语被用来描述同一概念。因此,为降低医学信息共享与互通的难度,需要根据医学术语的映射关系对非标准的医学术语进行标准化,以及及时判断不同医学术语之间是否符合映射关系。

2、目前现有的映射关系判断方法主要是依靠语义分析模型对不同医学术语进行语义分析,从而判断不同医学术语是否符合相应的映射关系。该方式需要消耗大量时间以及资源来开发和训练相应的语义分析模型,导致成本较高。并且,由于医疗领域的不断发展,需要定期对语义分析模型进行维护,否则容易导致后续判断的准确率降低。有鉴于此,如何提出一种准确率和效率较高的数据映射关系判断方法,成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种数据映射关系判断方法、系统以及相关装置,能够提高对不同数据之间的映射关系进行判断的准确性。

2、为解决上述技术问题,本申请采用的一个技术方案是:提供一种数据映射关系判断方法,包括:获取待判断数据,基于所述待判断数据,确定询问文本;其中,所述待判断数据包含原始数据和候选标准数据;将所述询问文本输入微调后的智能分析模型中,以得到表征所述原始数据和所述候选标准数据是否符合预设映射关系的判断结果;其中,所述智能分析模型是基于多个正样本和多个负样本进行微调得到的,所述正样本中包含原始训练数据以及匹配的标准训练数据,所述负样本是基于至少部分所述正样本中的原始训练数据与标准数据集中各个参考标准数据的相似度确定的,所述相似度与对应的所述原始训练数据和所述参考标准数据分别包含的元素相关。

3、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种数据映射关系判断系统,包括:处理模块,用于获取待判断数据,基于所述待判断数据,确定询问文本;其中,所述待判断数据包含原始数据和候选标准数据;判断模块,用于将所述询问文本输入微调后的智能分析模型中,以得到表征所述原始数据和所述候选标准数据是否符合预设映射关系的判断结果;其中,所述智能分析模型是基于多个正样本和多个负样本进行微调得到的,所述正样本中包含原始训练数据以及匹配的标准训练数据,所述负样本是基于至少部分所述正样本中的原始训练数据与标准数据集中各个参考标准数据的相似度确定的,所述相似度与对应的所述原始训练数据和所述参考标准数据分别包含的元素相关。

4、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括:相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现如上述技术方案中提到的数据映射关系判断方法。

5、为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如上述技术方案中提到的数据映射关系判断方法。

6、本申请的有益效果是:区别于现有技术的情况,本申请提出的数据映射关系判断方法,根据获取到的待判断数据生成询问文本,通过将询问文本输入至微调后的智能分析模型中,以得到准确表征待判断数据中原始数据和候选标准数据是否符合预设映射关系的判断结果。其中,响应于智能分析模型是利用多个正样本和多个负样本进行微调得到的,使得在微调过程中,智能分析模型可以同时学习相匹配的以及不匹配的非标准术语与标准术语之间的关系,从而提高微调后智能分析模型的判断准确性。另外,通过根据正样本中原始训练数据与多个参考标准数据之间的相似度来构建负样本,可以极大提高负样本的构建效率。

本文档来自技高网...

【技术保护点】

1.一种数据映射关系判断方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述待判断数据,确定询问文本,包括:

3.根据权利要求1所述的方法,其特征在于,响应于所述智能分析模型包括调节网络,所述智能分析模型微调的过程包括:

4.根据权利要求3所述的方法,其特征在于,所述基于至少部分所述正样本中的所述原始训练数据和所述标准数据集中各个所述参考标准数据之间的相似度,确定多个所述负样本,包括:

5.根据权利要求3所述的方法,其特征在于,所述构建所述正样本和所述负样本各自对应的训练样例,包括:

6.根据权利要求3所述的方法,其特征在于,所述利用所述训练样例对所述智能分析模型中的所述调节网络进行微调,以得到微调后的所述智能分析模型,包括:

7.根据权利要求3所述的方法,其特征在于,所述获取多个正样本,包括:

8.一种数据映射关系判断系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-7中任一项所述的数据映射关系判断方法。

10.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1-7中任一项所述的数据映射关系判断方法。

...

【技术特征摘要】

1.一种数据映射关系判断方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述待判断数据,确定询问文本,包括:

3.根据权利要求1所述的方法,其特征在于,响应于所述智能分析模型包括调节网络,所述智能分析模型微调的过程包括:

4.根据权利要求3所述的方法,其特征在于,所述基于至少部分所述正样本中的所述原始训练数据和所述标准数据集中各个所述参考标准数据之间的相似度,确定多个所述负样本,包括:

5.根据权利要求3所述的方法,其特征在于,所述构建所述正样本和所述负样本各自对应的训练样例,包括:

6.根据权利要求3所述的方法,...

【专利技术属性】
技术研发人员:张杰班启明王翔宋时德胡加学赵景鹤贺志阳
申请(专利权)人:讯飞医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1