数据处理方法、装置、设备及介质制造方法及图纸

技术编号:39064424 阅读:12 留言:0更新日期:2023-10-12 19:57
本发明专利技术涉及数据处理、数字医疗技术领域,公开了一种数据处理方法、装置、设备及介质,包括:获取第一目标医院的第一医院属性信息;根据第一医院属性信息确定第二目标医院集合;对第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合;获取第一属性文本与第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合;根据目标相似度集合和第一预设相似度阈值,从第二目标医院集合中确定出与第一目标医院对应的第二目标医院。采用本申请提供的方法,可有效提升医院实体对齐操作的效率,提高医院实体对齐操作的准确性。体对齐操作的准确性。体对齐操作的准确性。

【技术实现步骤摘要】
数据处理方法、装置、设备及介质


[0001]本专利技术涉及数据处理、数字医疗
,尤其涉及一种数据处理方法、装置、设备及介质。

技术介绍

[0002]目前,在基于数字医疗技术构建医院知识库的过程中,为了补充或提升自身医院知识库的字段属性,通常会涉及到将不同的医院知识库进行融合的操作。例如,在构建A医院知识库的过程中,可以将医保局对应医院知识库与A医院知识库进行融合,以获取A医院是否具有医保定点特征,从而为A医院的知识库补充相关的特征。其中,将不同来源的医院实体进行融合的过程中,很重要的一个步骤便是医院实体的对齐操作,对医疗实体进行对齐的操作可以理解为获取与A医院相同的医院。但是,目前针对医院实体的对齐操作不仅准确度不够,需要大量的人工标注数据来支持该对齐操作,从而导致了在进行医院实体进行对齐时的效率较低。

技术实现思路

[0003]本专利技术提供一种数据处理方法、装置、设备及介质,以解决在进行医院实体进行对齐时的效率较低的技术问题。
[0004]第一方面,提供了一种数据处理方法,包括:
[0005]获取第一目标医院的第一医院属性信息;
[0006]根据第一医院属性信息确定第二目标医院集合;
[0007]对第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合,第二属性文本集合中的第二属性文本与第二目标医院集合中的第二目标医院一一对应;
[0008]获取第一属性文本与第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,目标相似度集合中的目标相似度与第二属性文本集合中的第二属性文本一一对应;
[0009]根据目标相似度集合和第一预设相似度阈值,从第二目标医院集合中确定出与第一目标医院对应的第二目标医院。
[0010]第二方面,提供了一种数据处理装置,包括:
[0011]获取模块,用于获取第一目标医院的第一医院属性信息;
[0012]确定模块,用于根据第一医院属性信息确定第二目标医院集合;
[0013]处理模块,用于对第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合,第二属性文本集合中的第二属性文本与第二目标医院集合中的第二目标医院一一对应;
[0014]获取模块,还用于获取第一属性文本与第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,目标相似度集合中的目标相似度与第二属性文本集合中的第二属性文本一一对应;
[0015]确定模块,还用于根据目标相似度集合和第一预设相似度阈值,从第二目标医院集合中确定出与第一目标医院对应的第二目标医院。
[0016]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述数据处理方法的步骤。
[0017]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述数据处理方法的步骤。
[0018]上述数据处理方法、装置、设备及介质所实现的方案中,通过获取第一目标医院的第一医院属性信息,可以根据该第一医院属性信息确定第二目标医院集合,以对第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合,从而获取第一属性文本与第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,以进一步根据目标相似度集合和第一预设相似度阈值,从第二目标医院集合中确定出与第一目标医院对应的第二目标医院,进而有利于节省人工成本,提升了对医院实体进行对齐时的效率,还能有效地提高医院实体对齐操作的准确性。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本专利技术一实施例中数据处理方法的一应用环境示意图;
[0021]图2是本专利技术一实施例中数据处理方法的一流程示意图;
[0022]图3是本专利技术一实施例中数据处理装置的一结构示意图;
[0023]图4是本专利技术一实施例中计算机设备的一结构示意图;
[0024]图5是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]本专利技术实施例提供的数据处理方法,可应用在如图1的应用环境中,其中,客户端可以通过网络与服务端进行通信。示例性的,以数字医疗场景为例,以第一目标医院需要构建医院知识库为例,目标用户可以通过客户端上传第一目标医院的第一医院属性信息。其中,目标用户可以为数据处理装置的操作人员,本申请对此不作限制。相应的,服务端可以通过客户端获取到第一目标医院的第一医院属性信息,以根据该第一医院属性信息确定第
二目标医院集合;其中,第二目标医院集合中的第二目标医院可以为与第一目标医院具有相似性的医院。进一步的,服务端可以对第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合,从而获取第一属性文本与第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,以进一步根据目标相似度集合和第一预设相似度阈值,从第二目标医院集合中确定出与第一目标医院对应的第二目标医院;其中,该第二目标医院可以为服务端从第二目标医院集合中确定出的与第一目标医院为同一家医院的第二目标医院。服务端可以将该第二目标医院反馈至客户端;相应的,客户端可以接收来自服务端的第二目标医院,并可以在客户端上显示该第二目标医院,以供目标用户可以进一步基于该第二目标医院的医院知识库,对第一目标医院的医院知识库进行信息的扩充,进而提升第一目标医院的医院知识库的字段属性。通过采取本申请提供的数据处理方法,不仅可以有利于节省人工成本,提升对医院实体进行对齐时的效率,还能有效地提高医院实体对齐操作的准确性。
[0027]其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本专利技术进行详细的描述。
[0028]请参阅图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取第一目标医院的第一医院属性信息;根据所述第一医院属性信息确定第二目标医院集合;对所述第一医院属性信息进行文本描述处理,以得到第一属性文本,以及对第二目标医院集合中的每个第二目标医院的第二医院属性信息分别进行文本描述处理,以得到第二属性文本集合,所述第二属性文本集合中的第二属性文本与所述第二目标医院集合中的第二目标医院一一对应;获取所述第一属性文本与所述第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,所述目标相似度集合中的目标相似度与所述第二属性文本集合中的第二属性文本一一对应;根据所述目标相似度集合和第一预设相似度阈值,从所述第二目标医院集合中确定出与所述第一目标医院对应的第二目标医院。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一医院属性信息确定第二目标医院集合,包括:获取所述第一医院属性信息中的第一医院名称、第一医院地址和第一医院简介;获取与所述第一医院名称匹配的M个第一参考医院,M为正整数;获取与所述第一医院地址匹配的N个第二参考医院,N为正整数;获取与所述第一医院简介匹配的Q个第三参考医院,Q为正整数;将M个所述第一参考医院、N个所述第二参考医院和Q个所述第三参考医院确定为第二目标医院集合中的元素,得到第二目标医院集合。3.根据权利要求2所述的数据处理方法,其特征在于,所述获取与所述第一医院名称匹配的M个第一参考医院,包括:对所述第一医院名称进行关键字提取,以得到K个第一关键字;K为正整数;获取与K个所述第一关键字分别对应的第一参考医院名称,以得到第一参考医院名称集合;获取所述第一参考医院名称集合中的每个第一参考医院名称与所述第一医院名称之间的相似度,以得到第一相似度集合;根据所述第一相似度集合和第二预设相似度阈值从所述第一参考医院名称集合中确定出H个与所述第一医院名称对应的第一参考医院名称;H为小于或等于K的正整数;获取与所述第一医院名称对应的第二参考医院名称,以得到第二参考医院名称集合;将所述H个与所述第一医院名称对应的第一参考医院名称分别对应的医院和所述第二参考医院名称集合中的第二参考医院名称分别对应的医院,确定为与第一医院名称匹配的医院,以得到M个所述第一参考医院;M为大于或等于H的正整数。4.根据权利要求1所述的数据处理方法,其特征在于,所述对所述第一医院属性信息进行文本描述处理,以得到第一属性文本,包括:获取所述第一医院属性信息中的离散属性信息;对所述离散属性信息进行文本描述处理,以得到第一子属性文本;获取所述第一医院属性信息中的属性文本,以得到第二子属性文本;将所述第一子属性文本与所述第二子属性文本进行拼接处理,以得到所述第一属性文
本。5.根据权利要求1

4任一项所述的数据处理方法,其特征在于,所述获取所述第一属性文本与所述第二属性文本集合中每个第二属性文本之间的相似度,以得到目标相似度集合,包括:对所述第一属性文本进行特征编码,以得到第一特征向量;对所述第二属性文本集合中每个第二...

【专利技术属性】
技术研发人员:付桂振
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1