一种文本信息匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34900908 阅读:19 留言:0更新日期:2022-09-10 14:06
本发明专利技术公开了一种文本信息匹配方法、装置、电子设备及存储介质,其中,该方法包括:基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集;根据所述待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定所述待匹配向量与各候选集向量之间的待使用相似度;基于各待使用相似度,确定与所述待匹配文本相对应的目标子图集,以在检测到所述待匹配文本时,显示所述目标子图集。解决了文本信息匹配不够准确的问题,取到了对文本信息进行准确的匹配的效果。信息进行准确的匹配的效果。信息进行准确的匹配的效果。

【技术实现步骤摘要】
一种文本信息匹配方法、装置、电子设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种文本信息匹配方法、装置、电子设备及存储介质。

技术介绍

[0002]为了更加方便的查找数据,通常可以对该数据进行数据匹配,以得到与其最为接近的数据信息。
[0003]以医疗数据等信息为例,目前,确定与待匹配医疗数据信息相对应的最匹配的数据信息时,一般要先确定该医疗数据涉及的实体,如疾病、医疗耗材以及相关药物信息等,通过在实体字典库中的实体进行对码,或者将信息以向量化表示根据向量的匹配度,得到与该医疗数据最为匹配的数据信息。但是对码的过程中信息量较为单一,而向量化的表示方法也较为单一,最终的信息匹配效果一般。
[0004]为了改进上述问题,需要对信息匹配的方法进行改进。

技术实现思路

[0005]本专利技术提供了一种文本信息匹配方法、装置、电子设备及存储介质,以解决文本信息匹配不够准确的问题。
[0006]第一方面,本专利技术实施例提供了一种文本信息匹配方法,包括:
[0007]基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集;其中,所述文本知识图谱为用于表征文本之间关系的语义图谱,所述候选子图中包括候选文本,以及至少一个与所述候选文本语义关联的候选关联文本;
[0008]根据所述待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定所述待匹配向量与各候选集向量之间的待使用相似度;
[0009]基于各待使用相似度,确定与所述待匹配文本相对应的目标子图集,以在检测到所述待匹配文本时,显示所述目标子图集。
[0010]第二方面,本专利技术实施例还提供了一种文本信息匹配装置,包括:
[0011]候选子图集确定模块,用于基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集;其中,所述文本知识图谱为用于表征文本之间关系的语义图谱,所述候选子图集中包括候选文本,以及至少一个与所述候选文本语义关联的候选关联文本;
[0012]待使用相似度确定模块,用于根据所述待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定所述待匹配向量与各候选集向量之间的待使用相似度;
[0013]目标子图集确定模块,用于基于各待使用相似度,确定与所述待匹配文本相对应的目标子图集,以在检测到所述待匹配文本时,显示所述目标子图集。
[0014]第三方面,本专利技术实施例还提供了一种电子设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的文本信息匹配方法。
[0018]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的文本信息匹配方法。
[0019]本实施例的技术方案,基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集,在输入待匹配文本后,基于文本知识图谱可以确定与待匹配文本相对应的至少一个候选文本,以及与各候选文本相关联的候选关联文本,以基于候选文本以及相应的候选关联文本构成相应的候选子图集。根据待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定待匹配向量与各候选集向量之间的待使用相似度,基于至少两种向量处理方式分别对待匹配文本进行向量转化,以及基于相同的向量处理方式对各候选子图集进行向量化处理,得到与各候选子图集相对应的候选集向量,并基于相似度算法确定待匹配向量与各候选集向量之间的待使用相似度。基于各待使用相似度,确定与待匹配文本相对应的目标子图集,以在检测到待匹配文本时,显示目标子图集,将待使用相似度最高的候选集向量所对应的候选子图集确定为与待匹配文本相对应的目标子图集,以在检测到待匹配文本时,调用与待匹配文本相对应的目标子图集,并显示。解决了文本信息匹配不够准确的问题,取到了对文本信息进行准确的匹配的效果。
[0020]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是根据本专利技术实施例一提供的一种文本信息匹配方法的流程图;
[0023]图2是根据本专利技术实施例二提供的一种文本信息匹配方法的流程图;
[0024]图3是根据本专利技术实施例三提供的候选子图集的示意图;
[0025]图4是根据本专利技术实施例四提供的一种文本信息匹配装置的结构示意图;
[0026]图5是实现本专利技术实施例的文本信息匹配方法的电子设备的结构示意图。
具体实施方式
[0027]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0028]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
[0029]实施例一
[0030]图1为本专利技术实施例一提供了一种文本信息匹配方法的流程图,本实施例可适用于对文本信息进行信息匹配的情况,该方法可以由文本信息匹配装置来执行,该文本信息匹配装置可以采用硬件和/或软件的形式实现,该文本信息匹配装置可配置于可执行文本信息匹配方法的计算设备中。
[0031]如图1所示,该方法包括:
[0032]S110、基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集。
[0033]其中,文本知识图谱可以理解为以结构化的形式描述客观世界中概念、实体机器关系的图谱,在本技术方案中可以理解为用于表征文本之间关系的语义图谱。待匹配文本可以理解为需要进行信息匹配的文本,示例性地,用户在需要查询与某些疾病相关联的药品信息时,可以输入与该疾病相对应的文本信息,即为待匹配文本,以基于文本知识图谱确定与待匹配文本相对应的药品信息。候选子图集中包括候选文本,以及至少一个与候选文本语义关联的候选关联文本。可以理解的是,在基于文本知识图谱确定与待匹配文本相对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本信息匹配方法,其特征在于,包括:基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集;其中,所述文本知识图谱为用于表征文本之间关系的语义图谱,所述候选子图集中包括候选文本,以及至少一个与所述候选文本语义关联的候选关联文本;根据所述待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定所述待匹配向量与各候选集向量之间的待使用相似度;基于各待使用相似度,确定与所述待匹配文本相对应的目标子图集,以在检测到所述待匹配文本时,显示所述目标子图集。2.根据权利要求1所述的方法,其特征在于,在所述基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集之前,还包括:获取基础知识图谱;其中,所述基础知识图谱为具有时效性的文本知识图谱;确定与所述基础知识图谱相对应的图谱更新信息表,以基于所述图谱更新信息表,对所述基础知识图谱进行更新得到所述文本知识图谱;其中,所述图谱更新信息表中包括所述基础知识图谱中的至少一个待更新文本,以及相应的更新时间。3.根据权利要求1所述的方法,其特征在于,所述基于文本知识图谱,确定与待匹配文本相对应的至少一个候选子图集,包括:确定与所述待匹配文本相对应的待使用关键词;基于预设关联匹配算法,从所述文本知识图谱中获取与所述待使用关键词相关联的至少一个候选文本;针对各候选文本,基于当前候选文本以及与所述当前候选文本相关联的候选关联文本,生成相应的当前子图集。4.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配文本的待匹配向量,以及与各候选子图集相对应的候选集向量,确定所述待匹配向量与各候选集向量之间的待使用相似度,包括:基于至少两种向量处理方式,对所述待匹配文本进行向量转化,得到与所述待匹配文本相对应的待匹配向量;以及基于所述至少两种向量处理方式,对各所述候选子图集分别进行向量转化,得到相应的候选集向量;确定所述待匹配向量与各候选集向量之间的待使用距离,基于与各向量处理方式相对应的待使用权重,对相应的待使用距离进行加权处理,得到所述待匹配向量与各所述候选集向量之间的待使用相似度。5.根据权利要求4所述的方法,其特征在于,所述基于所述至少两种向量处理方式,对各所述候选子图集分别进行向量转化,得到相应的候选集向量,包括:针对各候选子图集,基于所述...

【专利技术属性】
技术研发人员:罗永贵肖劲刘霄晨
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1