基于特征划分的患者身份信息匹配方法、装置及电子设备制造方法及图纸

技术编号:38583673 阅读:8 留言:0更新日期:2023-08-26 23:27
本发明专利技术属于医疗数据处理技术领域,涉及基于特征划分的患者身份信息匹配方法、装置及电子设备。该方法包括:获取患者信息数据;预处理;选择患者信息属性对患者信息数据进行若干次划分;计算各个患者信息属性与参考患者信息数据的各个患者信息属性的相似度,加权求和得到总相似度值;得到患者信息特征数据集中所有患者信息数据与参考患者信息数据的总相似度值;确定属于同一患者的所有患者信息数据,得到同一患者的主索引数据;得到所有患者的患者主索引数据。本发明专利技术能够提高海量患者信息数据匹配的速度和效率,有效提高患者信息数据匹配的准确性,有利于医院内部处理堆积冗杂的患者数据,准确构建患者主索引数据,有利于构建患者病历数据库。者病历数据库。者病历数据库。

【技术实现步骤摘要】
基于特征划分的患者身份信息匹配方法、装置及电子设备


[0001]本专利技术涉及医疗数据处理
,具体而言,涉及基于特征划分的患者身份信息匹配方法、装置及电子设备。

技术介绍

[0002]近年来,患者主索引技术在不断的开发与进步,由于患者数据量庞大,在数据匹配的过程中会出现很多无效匹配,一条患者数据会与大量毫无关联的数据进行比较,效率大打折扣,并且在进行患者数据相似度计算的过程中,单一的相似度算法无法满足不同患者属性信息的需求,在匹配过程中无法做到精确匹配。在合并患者信息的过程中,如何选择患者主索引数据中包含的患者属性信息存在较大的问题。

技术实现思路

[0003]为了解决上述技术问题,本专利技术提供基于特征划分的患者身份信息匹配方法、装置及电子设备。
[0004]第一方面,本专利技术提供了基于特征划分的患者身份信息匹配方法,包括:获取患者信息数据;对所述患者信息数据进行预处理;从所述患者信息数据中选择若干个患者信息属性作为划分特征;利用所述划分特征对所述患者信息数据进行若干次划分,得到若干个患者信息特征数据集;根据所述患者信息属性的字段特征选择字符串相似度算法;根据所有所述患者信息数据中的单个所述患者信息属性的重复条数,确定各个所述患者信息属性的权重值;选取所述患者信息特征数据集中一条参考患者信息数据,利用所述字符串相似度算法计算该所述患者信息特征数据集中所述患者信息数据的各个所述患者信息属性与所述参考患者信息数据的各个所述患者信息属性的相似度,根据各个所述患者信息属性的权重值对所述患者信息属性的相似度进行加权求和,得到该所述患者信息特征数据集中单个所述患者信息数据与所述参考患者信息数据的总相似度值;遍历所述患者信息特征数据集中所有所述患者信息数据,得到所述患者信息特征数据集中所有所述患者信息数据与所述参考患者信息数据的所述总相似度值;根据所有所述总相似度值,确定属于同一患者的所有所述患者信息数据,将属于同一患者的所有所述患者信息数据放入同一合并集,得到同一患者的主索引数据;获取所有患者的所述患者信息数据的合并集,得到所有患者的患者主索引数据。
[0005]第二方面,本专利技术提供了基于特征划分的患者身份信息匹配装置,包括第一获取单元、预处理单元、第一选择单元、划分单元、第二选择单元、权重值确定单元、第一处理单元、遍历单元、第二处理单元与第二获取单元;
所述第一获取单元,用于获取患者信息数据;所述预处理单元,用于对所述患者信息数据进行预处理;所述第一选择单元,用于从所述患者信息数据中选择若干个患者信息属性作为划分特征;所述划分单元,用于利用所述划分特征对所述患者信息数据进行若干次划分,得到若干个患者信息特征数据集;所述第二选择单元,用于根据所述患者信息属性的字段特征选择字符串相似度算法;所述权重值确定单元,用于根据所有所述患者信息数据中的单个所述患者信息属性的重复条数,确定各个所述患者信息属性的权重值;所述第一处理单元,用于选取所述患者信息特征数据集中一条参考患者信息数据,利用所述字符串相似度算法计算该所述患者信息特征数据集中所述患者信息数据的各个所述患者信息属性与所述参考患者信息数据的各个所述患者信息属性的相似度,根据各个所述患者信息属性的权重值对所述患者信息属性的相似度进行加权求和,得到该所述患者信息特征数据集中单个所述患者信息数据与所述参考患者信息数据的总相似度值;所述遍历单元,用于遍历所述患者信息特征数据集中所有所述患者信息数据,得到所述患者信息特征数据集中所有所述患者信息数据与所述参考患者信息数据的所述总相似度值;所述第二处理单元,用于根据所有所述总相似度值,确定属于同一患者的所有所述患者信息数据,将属于同一患者的所有所述患者信息数据放入同一合并集,得到同一患者的主索引数据;所述第二获取单元,用于获取所有患者的所述患者信息数据的合并集,得到所有患者的患者主索引数据。
[0006]第三方面,本专利技术提供了一种电子设备,包括:处理器和存储器;所述存储器,用于存储计算机操作指令;所述处理器,用于通过调用所述计算机操作指令,执行所述的基于特征划分的患者身份信息匹配方法。
[0007]在上述技术方案的基础上,本专利技术还可以做如下改进。
[0008]进一步,所述患者信息数据包括患者身份信息数据与患者病历数据;所述患者身份信息数据包括患者姓名、性别、民族、身份证号、电话号码与家庭住址。
[0009]进一步,对所述患者信息数据进行预处理,包括:对所述患者信息数据进行转换,使得表示相同含义的所述患者信息数据的描述方式统一;采用对所述患者信息数据与患者病历数据比对的方式进行错别字纠正。
[0010]进一步,所述字符串相似度算法包括:集合算法、最长公共子序列算法、编辑距离算法、余弦相似度算法与Jaccard相似度算法。
[0011]进一步,根据所有所述总相似度值,确定属于同一患者的所述患者信息数据与所述参考患者信息数据,包括:设定所述总相似度值范围,若所述总相似度值在所述总相似度值范围内,则所述
患者信息数据与所述参考患者信息数据属于同一患者,否则所述患者信息数据与所述参考患者信息数据不属于同一患者。
[0012]进一步,将属于同一患者的所有所述参考患者信息数据放入同一合并集,包括:选取一个所述合并集中的一条所述患者信息数据,将该所述患者信息数据的每个所述患者信息属性逐一与该所述合并集中的所述患者信息数据的所述患者信息属性进行相似度计算,得到相似度分值;计算所有所述相似度分值的平均值,得到相似度平均分值,选取所述相似度平均分值最大的所述患者信息属性对应的所述患者信息数据作为患者主索引数据。
[0013]本专利技术的有益效果是:本专利技术能够提高海量患者信息数据匹配的速度和效率,减少算法的时间复杂度,并有效提高患者信息数据匹配的准确性,有利于医院内部处理堆积冗杂的患者数据,准确构建患者主索引数据,有利于构建患者病历数据库。
附图说明
[0014]图1为本专利技术实施例1提供的基于特征划分的患者身份信息匹配方法的原理图;图2为本专利技术实施例2提供的基于特征划分的患者身份信息匹配装置的原理图;图3为本专利技术实施例3提供的一种电子设备的原理图。
[0015]图标:30

电子设备;310

处理器;320

总线;330

存储器;340

收发器。
具体实施方式
[0016]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0017]实施例1作为一个实施例,如附图1所示,为解决上述技术问题,本实施例提供基于特征划分的患者身份信息匹配方法,包括:获取患者信息数据;对患者信息数据进行预处理;从患者信息数据中选择若干个患者信息属性作为划分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于特征划分的患者身份信息匹配方法,其特征在于,包括:获取患者信息数据;对所述患者信息数据进行预处理;从所述患者信息数据中选择若干个患者信息属性作为划分特征;利用所述划分特征对所述患者信息数据进行若干次划分,得到若干个患者信息特征数据集;根据所述患者信息属性的字段特征选择字符串相似度算法;根据所有所述患者信息数据中的单个所述患者信息属性的重复条数,确定各个所述患者信息属性的权重值;选取所述患者信息特征数据集中一条参考患者信息数据,利用所述字符串相似度算法计算该所述患者信息特征数据集中所述患者信息数据的各个所述患者信息属性与所述参考患者信息数据的各个所述患者信息属性的相似度,根据各个所述患者信息属性的权重值对所述患者信息属性的相似度进行加权求和,得到该所述患者信息特征数据集中单个所述患者信息数据与所述参考患者信息数据的总相似度值;遍历所述患者信息特征数据集中所有所述患者信息数据,得到所述患者信息特征数据集中所有所述患者信息数据与所述参考患者信息数据的所述总相似度值;根据所有所述总相似度值,确定属于同一患者的所有所述患者信息数据,将属于同一患者的所有所述患者信息数据放入同一合并集,得到同一患者的主索引数据;获取所有患者的所述患者信息数据的合并集,得到所有患者的患者主索引数据。2.根据权利要求1所述基于特征划分的患者身份信息匹配方法,其特征在于,所述患者信息数据包括患者身份信息数据与患者病历数据;所述患者身份信息数据包括患者姓名、性别、民族、身份证号、电话号码与家庭住址。3.根据权利要求1所述基于特征划分的患者身份信息匹配方法,其特征在于,对所述患者信息数据进行预处理,包括:对所述患者信息数据进行转换,使得表示相同含义的所述患者信息数据的描述方式统一;采用对所述患者信息数据与患者病历数据比对的方式进行错别字纠正。4.根据权利要求1所述基于特征划分的患者身份信息匹配方法,其特征在于,所述字符串相似度算法包括:集合算法、最长公共子序列算法、编辑距离算法、余弦相似度算法与Jaccard相似度算法。5.根据权利要求1所述基于特征划分的患者身份信息匹配方法,其特征在于,根据所有所述总相似度值,确定属于同一患者的所述患者信息数据与所述参考患者信息数据,包括:设定所述总相似度值范围,若所述总相似度值在所述总相似度值范围内,则所述患者信息数据与所述参考患者信息数据属于同一患者,否则所述患者信息数据与所述参考患者信息数据不属于同一患者。6.根据权利要求1所述基于...

【专利技术属性】
技术研发人员:余泓棹梁冬亮叶娟
申请(专利权)人:四川互慧软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1