诊断数据识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号:34246980 阅读:53 留言:0更新日期:2022-07-24 10:36
本公开实施例是关于一种诊断数据识别方法及装置、电子设备、存储介质,涉及医疗大数据技术领域,该诊断数据识别方法包括:基于历史医疗数据获取待处理对象的原始诊断数据,并获取候选诊断数据;根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果;基于所述匹配结果对原始诊断数据进行归一化处理,并根据归一化结果对所述待处理对象对应的原始诊断数据进行识别,以确定目标诊断结果。本公开实施例中的技术方案,能够准确识别原始诊断数据的目标诊断结果,提高识别效率。提高识别效率。提高识别效率。

Diagnostic data identification method and device, electronic equipment, storage medium

【技术实现步骤摘要】
诊断数据识别方法及装置、电子设备、存储介质


[0001]本公开涉及医疗大数据
,具体而言,涉及一种诊断数据识别方法、诊断数据识别装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]在识别用户的既往症时,需要将用户的诊断数据进行标准化,并在标准化后进行识别。
[0003]相关技术中,可根据一个周期内已赔付的医疗记录来标识既往症人群,或者是进行人工识别。上述方式中,可能存在漏识别或者是误识别的问题,覆盖范围不全面,识别准确性较低;人工方式的识别标准不一致,且识别效率较低。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种诊断数据识别方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的准确性较差的问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]根据本公开的第一方面,提供一种诊断数据识别方法,包括:基于历史医疗数据获取待处理对象的原始诊断数据,并获取候选诊断数据;根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果;基于所述匹配结果对原始诊断数据进行归一化处理,并根据归一化结果对所述待处理对象对应的原始诊断数据进行识别,以确定目标诊断结果。
[0008]在本公开的一种示例性实施例中,所述根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果,包括:对所述原始诊断数据以及所述候选诊断数据进行特征提取,得到语义特征;根据所述语义特征计算所述原始诊断数据和所述候选诊断数据的语义相似度;基于所述语义相似度进行分类,确定所述原始诊断数据以及所述候选诊断数据的所述匹配结果。
[0009]在本公开的一种示例性实施例中,所述根据所述语义特征计算所述原始诊断数据和所述候选诊断数据的语义相似度,包括:对所述原始诊断数据和所述候选诊断数据的中间特征进行特征提取,获取所述语义特征;将所述语义特征进行相似度计算,确定所述语义相似度。
[0010]在本公开的一种示例性实施例中,所述根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果,包括:通过归一模型对所述原始诊断数据以及所述候选诊断数据进行相似度计算,以确定所述匹配结果;其中,所述归一模型包括多个编码器、多层感知机以及分类层。
[0011]在本公开的一种示例性实施例中,所述通过归一模型对所述原始诊断数据以及所述候选诊断数据进行相似度计算,以确定所述匹配结果,包括:通过多个编码器对所述原始诊断数据以及所述候选诊断数据进行特征提取,获取所述原始诊断数据和所述候选诊断数据中每个单词之间的关系特征作为所述语义特征;基于多层感知机和分类层对所述语义特征进行相似度计算,获取所述语义相似度;对所述语义相似度进行分类处理,确定所述匹配结果。
[0012]在本公开的一种示例性实施例中,所述方法还包括:通过通用语料对语言模型进行训练,得到通用语言模型;通过医疗文本语料对所述通用语言模型进行训练,得到医疗语言模型;通过目标任务对应的训练数据对医疗语言模型进行训练,得到所述归一模型。
[0013]在本公开的一种示例性实施例中,所述通过目标任务对应的训练数据对医疗语言模型进行训练,得到所述归一模型,包括:通过数据归一任务中已标注诊断数据以及所述已标注诊断数据对应的标准诊断数据,对所述医疗语言模型进行训练,得到所述归一模型。
[0014]在本公开的一种示例性实施例中,所述基于所述匹配结果对原始诊断数据进行归一化处理,并根据归一化结果对所述待处理对象对应的原始诊断数据进行识别,以确定目标诊断结果,包括:若匹配结果为匹配成功,根据所述候选诊断数据将所述原始诊断数据进行归一化处理,得到所述原始诊断数据对应的标准诊断数据;将所述标准诊断数据与参考诊断数据进行匹配,并根据匹配成功的参考诊断数据的类型确定所述待处理对象的原始诊断数据对应的目标诊断标签。
[0015]在本公开的一种示例性实施例中,所述基于历史医疗数据获取待处理对象的原始诊断数据,包括:将所述历史医疗数据对应的病历数据中的疾病关联数据进行提取,以获取所述原始诊断数据。
[0016]在本公开的一种示例性实施例中,所述方法还包括:根据所述原始诊断数据中的序号信息对所述原始诊断数据进行切分;或,通过序列标注模型对所述原始诊断数据进行序列识别,以对所述原始诊断数据进行切分。
[0017]根据本公开的第二方面,提供一种诊断数据识别装置,包括:诊断数据获取模块,用于基于历史医疗数据获取待处理对象的原始诊断数据,并获取候选诊断数据;匹配模块,用于根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果;识别模块,用于基于所述匹配结果对原始诊断数据进行归一化处理,并根据归一化结果对所述待处理对象对应的原始诊断数据进行识别,以确定目标诊断结果。
[0018]根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面的诊断数据识别方法及其可能的实现方式。
[0019]根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的诊断数据识别方法及其可能的实现方式。
[0020]本公开实施例中提供的诊断数据识别方法、诊断数据识别装置、电子设备以及计算机可读存储介质中,一方面,通过将原始诊断数据与候选诊断数据进行组合,根据二者的语义特征来确定原始诊断数据和候选诊断数据之间的匹配结果,基于匹配结果对原始诊断
数据进行归一化处理,以根据所述候选诊断数据确定所述待处理对象的目标诊断结果,能够避免只根据部分医疗记录进行目标诊断结果识别所导致的局限性,能够从待处理对象的原始诊断数据的特征进行全面识别,能够进行全面地精准识别,提高识别的准确性。另一方面,通过对待处理对象的原始诊断数据以及与其对应的候选诊断数据进行匹配,将原始诊断数据转换为对应的编码,以对原始诊断数据进行归一标准化,从而基于标准化的原始诊断数据实现目标诊断结果的自动识别,减少计算量,能够提高通用性,且提高了识别效率。
[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种诊断数据识别方法,其特征在于,包括:基于历史医疗数据获取待处理对象的原始诊断数据,并获取候选诊断数据;根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果;基于所述匹配结果对原始诊断数据进行归一化处理,并根据归一化结果对所述待处理对象对应的原始诊断数据进行识别,以确定目标诊断结果。2.根据权利要求1所述的诊断数据识别方法,其特征在于,所述根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果,包括:对所述原始诊断数据以及所述候选诊断数据进行特征提取,得到语义特征;根据所述语义特征计算所述原始诊断数据和所述候选诊断数据的语义相似度;基于所述语义相似度进行分类,确定所述原始诊断数据以及所述候选诊断数据的所述匹配结果。3.根据权利要求2所述的诊断数据识别方法,其特征在于,所述对所述原始诊断数据以及所述候选诊断数据进行特征提取,得到语义特征,包括:对所述原始诊断数据和所述候选诊断数据的中间特征进行特征提取,获取每个单词的关系特征;对所述关系特征进行映射处理,生成所述语义特征。4.根据权利要求1所述的诊断数据识别方法,其特征在于,所述根据所述原始诊断数据和所述候选诊断数据的语义特征,确定所述原始诊断数据和所述候选诊断数据之间的匹配结果,包括:通过归一模型对所述原始诊断数据以及所述候选诊断数据进行相似度计算,以确定所述匹配结果;其中,所述归一模型包括多个编码器、多层感知机以及分类层。5.根据权利要求4所述的诊断数据识别方法,其特征在于,所述通过归一模型对所述原始诊断数据以及所述候选诊断数据进行相似度计算,以确定所述匹配结果,包括:通过多个编码器对所述原始诊断数据以及所述候选诊断数据进行特征提取,获取所述原始诊断数据和所述候选诊断数据中每个单词之间的关系特征作为所述语义特征;基于多层感知机和分类层对所述语义特征进行相似度计算,获取所述语义相似度;对所述语义相似度进行分类处理,确定所述匹配结果。6.根据权利要求4所述的诊断数据识别方法,其特征在于,所述方法还包括:通过通用语料对语言模型进行训练,得到通用语言模型;通过医疗文本语料对所述通用语言模型进行训练,得到医疗语言模型;通过目标任务对应的训练数据对医疗语言...

【专利技术属性】
技术研发人员:亓玉雪
申请(专利权)人:天津幸福生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1