基于患者主索引的患者记录匹配方法、存储介质及设备组成比例

技术编号:32493352 阅读:14 留言:0更新日期:2022-03-02 10:00
本发明专利技术提供一种基于患者主索引的患者记录匹配方法、存储介质及设备,所述基于患者主索引的患者记录匹配方法包括:基于患者信息数据库中抽取的患者信息集确定训练样本和测试样本;分别对所述训练样本的属性进行变量分析;比较变量分析后的训练样本与所述测试样本,通过所述训练样本的偏好权重调整所述训练样本与所述测试样本之间的相似程度;利用所述训练样本训练患者匹配模型,获取所述训练样本的权重和阈值;通过所述测试样本对所述权重和所述阈值进行效果评估。本发明专利技术通过自动生成效果优秀的权重和阈值,节省人工工作量,实现更科学地患者记录匹配过程。科学地患者记录匹配过程。科学地患者记录匹配过程。

【技术实现步骤摘要】
基于患者主索引的患者记录匹配方法、存储介质及设备


[0001]本专利技术属于医疗数据处理的
,涉及一种患者记录匹配方法,特别是涉及一种基于患者主索引的患者记录匹配方法、存储介质及设备。

技术介绍

[0002]患者主索引(Enterprise Master Patient Index,EMPI)是患者基本信息检索目录。其目的是将一个系统内多条记录,或多个系统的多条记录有效的关联在一起。患者主索引核心的功能是基于患者记录相似度的匹配算法。将一条新注册的患者记录与数据库中已知EMPI号的患者记录进行相似度计算。目前现有技术中的两种匹配算法:一种是大权重优先算法,另一种是综合权重算法。两种算法都需要设置各个患者属性比较结果的权重以及匹配上下阈值。进而两种算法通过各个属性比较结果与对应的属性比较结果权重计算出两条患者记录的相似度。若相似度超过上阈值,进行合并;若相似度低于下阈值,进行新患者注册。两种算法中,人工参与判断比较多。
[0003]上述现有方案存在的缺陷主要包括以下几个方面:(1)属性比较结果权重为人工设置。(2)上下阈值为人工设置。人工设置权重与阈值依赖主观经验,缺乏科学依据。而且需要进行多次迭代调整权重,阈值才能使EMPI患者匹配算法效果最佳,人工工作量巨大。
[0004]因此,如何提供一种基于患者主索引的患者记录匹配方法、存储介质及设备,以解决现有技术无法在患者记录匹配过程中节省人工工作量,实现更科学地匹配等缺陷,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于患者主索引的患者记录匹配方法、存储介质及设备,用于解决现有技术无法在患者记录匹配过程中节省人工工作量,实现更科学地匹配的问题。
[0006]为实现上述目的及其他相关目的,本专利技术一方面提供一种基于患者主索引的患者记录匹配方法,其特征在于,所述基于患者主索引的患者记录匹配方法包括:基于患者信息数据库中抽取的患者信息集确定训练样本和测试样本;分别对所述训练样本的属性进行变量分析;比较变量分析后的训练样本与所述测试样本,通过所述训练样本的偏好权重调整所述训练样本与所述测试样本之间的相似程度;利用所述训练样本训练患者匹配模型,获取所述训练样本的权重和阈值;通过所述测试样本对所述权重和所述阈值进行效果评估。
[0007]于本专利技术的一实施例中,所述基于患者信息数据库中抽取的患者信息集确定训练样本和测试样本的步骤,包括:利用预设抽取条件,抽取所述训练样本,通过唯一标识信息对所述训练样本进行标注;通过实际医院的匹配候选规则抽取所述测试样本,通过所述唯一标识信息对所述测试样本进行标注。
[0008]于本专利技术的一实施例中,所述分别对所述训练样本的属性进行变量分析的步骤,包括:对所述训练样本的属性进行单变量分析,所述单变量分析内容包括:缺失率和方差;
对所述训练样本的属性进行多变量分析,所述多变量分析内容包括:皮尔森相关系数和方差膨胀系数;通过所述单变量分析的结果和所述多变量分析的结果排除所述训练样本的不利属性;响应于所述训练样本的属性为多元变量,对所述多元变量进行降维处理。
[0009]于本专利技术的一实施例中,所述比较变量分析后的训练样本与所述测试样本,通过所述训练样本的偏好权重调整所述训练样本与所述测试样本之间的相似程度的步骤,包括:利用迁移学习计算所述训练样本与所述测试样本的密度比;所述测试样本与所述训练样本的数量相同,所述密度比为所述患者匹配模型训练过程中所述训练样本的偏好权重。
[0010]于本专利技术的一实施例中,所述利用所述训练样本训练患者匹配模型,获取所述训练样本的权重和阈值的步骤,包括:利用所述训练样本,基于监督式学习模型训练得到所述患者匹配模型;将所述患者匹配模型的权重进行总分标准化;对每一个所述训练样本进行0分至100分的相似度计算;利用主要统计指标确定候选阈值对,根据次要统计指标确定上下阈值。
[0011]于本专利技术的一实施例中,所述通过所述测试样本对所述权重和所述阈值进行效果评估的步骤,包括:获取用户自定义权重和自定义阈值;生成所述自定义权重和所述自定义阈值在所述测试样本上的自定义统计指标;比对所述患者匹配模型的统计指标与所述自定义统计指标的大小关系;所述统计指标包括:准确率、人工参与百分比、召回率、错判率和F1值。
[0012]于本专利技术的一实施例中,所述基于患者主索引的患者记录匹配方法还包括:对效果评估的结果进行可视化呈现,可视化呈现的方式包括:文字、图片、表格或统计图中的至少一种。
[0013]于本专利技术的一实施例中,所述对效果评估的结果进行可视化呈现的步骤,包括:针对所述权重和所述阈值在所述测试样本中的统计指标结果,进行可视化web访问。
[0014]为实现上述目的及其他相关目的,本专利技术另一方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于患者主索引的患者记录匹配方法。
[0015]为实现上述目的及其他相关目的,本专利技术最后一方面提供一种电子设备,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行所述的基于患者主索引的患者记录匹配方法。
[0016]如上所述,本专利技术所述的基于患者主索引的患者记录匹配方法、存储介质及设备,具有以下有益效果:
[0017]本专利技术对抽取的训练样本进行变量分析处理,且利用偏好权重使得处理后的训练样本更接近实际测试样本,进而自动生成效果优秀的权重和阈值,节省人工工作量,实现更科学地患者记录匹配过程。本专利技术不需要花费大量时间进行权重、阈值的迭代调整。训练样本与测试样本由本专利技术自动生成及标注,仅设置少量统计指标,通过监督式学习自动获取权重与阈值,减少了大量人工工作量。并且通过统计指标,自动选择权重、阈值。进一步将基于此权重、阈值的匹配算法对于测试样本的统计结果进行可视化呈现,可以与选择其他权重、阈值的匹配算法进行比较,了解各种权重阈值选择的优劣,便于确认各种选择的合理性。
附图说明
[0018]图1显示为本专利技术的基于患者主索引的患者记录匹配方法于一实施例中的原理流程图。
[0019]图2显示为本专利技术的基于患者主索引的患者记录匹配方法于一实施例中的数据处理示意图。
[0020]图3A显示为本专利技术的基于患者主索引的患者记录匹配方法于一实施例中的随机抽样匹配算法的分值分布图。
[0021]图3B显示为本专利技术的基于患者主索引的患者记录匹配方法于一实施例中的条件抽样匹配算法的分值分布图。
[0022]图4显示为本专利技术的基于患者主索引的患者记录匹配方法于一实施例中的训练样本与实际测试样本中电话号比较结果分布图。
[0023]图5显示为本专利技术的电子设备于一实施例中的结构连接示意图。
[0024]元件标号说明
[0025]5电子设备
[0026]51处理器
[0027]52存储器...

【技术保护点】

【技术特征摘要】
1.一种基于患者主索引的患者记录匹配方法,其特征在于,所述基于患者主索引的患者记录匹配方法包括:基于患者信息数据库中抽取的患者信息集确定训练样本和测试样本;分别对所述训练样本的属性进行变量分析;比较变量分析后的训练样本与所述测试样本,通过所述训练样本的偏好权重调整所述训练样本与所述测试样本之间的相似程度;利用所述训练样本训练患者匹配模型,获取所述训练样本的权重和阈值;通过所述测试样本对所述权重和所述阈值进行效果评估。2.根据权利要求1所述的基于患者主索引的患者记录匹配方法,其特征在于,所述基于患者信息数据库中抽取的患者信息集确定训练样本和测试样本的步骤,包括:利用预设抽取条件,抽取所述训练样本,通过唯一标识信息对所述训练样本进行标注;通过实际医院的匹配候选规则抽取所述测试样本,通过所述唯一标识信息对所述测试样本进行标注。3.根据权利要求1所述的基于患者主索引的患者记录匹配方法,其特征在于,所述分别对所述训练样本的属性进行变量分析的步骤,包括:对所述训练样本的属性进行单变量分析,所述单变量分析内容包括:缺失率和方差;对所述训练样本的属性进行多变量分析,所述多变量分析内容包括:皮尔森相关系数和方差膨胀系数;通过所述单变量分析的结果和所述多变量分析的结果排除所述训练样本的不利属性;响应于所述训练样本的属性为多元变量,对所述多元变量进行降维处理。4.根据权利要求1所述的基于患者主索引的患者记录匹配方法,其特征在于,所述比较变量分析后的训练样本与所述测试样本,通过所述训练样本的偏好权重调整所述训练样本与所述测试样本之间的相似程度的步骤,包括:利用迁移学习计算所述训练样本与所述测试样本的密度比;所述测试样本与所述训练样本的数量相同,所述密度比为所述患者匹配模型训练过程中所述训练样本的偏好权重。5.根据权...

【专利技术属性】
技术研发人员:张少典马汉东沈一如朱珉薛颜波
申请(专利权)人:上海森亿医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1