基于相似性学习的就医迁移方案推荐方法及系统技术方案

技术编号:23932610 阅读:48 留言:0更新日期:2020-04-25 02:00
本公开公开了基于相似性学习的就医迁移方案推荐方法及系统,所述方法包括:训练阶段和应用阶段;所述训练阶段,包括:获取所有医保人员的历史就医数据,基于获取的数据训练出就医迁移方案推荐模型;所述应用阶段,包括:基于就医迁移方案推荐模型,为待推荐患者推荐出不同就医迁移方案的推荐比例,给予患者就医迁移的建议。

Recommendation method and system of medical transfer scheme based on similarity learning

【技术实现步骤摘要】
基于相似性学习的就医迁移方案推荐方法及系统
本公开涉及医保信息处理
,特别是涉及基于相似性学习的就医迁移方案推荐方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。随着城市医疗水平的差异化发展、各地医疗知识网络的普及和居民生活水平的上升,为就医个体迁至更高治疗水平和更优惠报销政策的医院就医提供了条件,由此导致就医迁移问题日益突出和各医院医疗资源利用率的此消彼长,进而造成了医疗资源的浪费;同时,互联网发展导致信息交互水平不断提升、医疗水平被认知的同时,作为双刃剑也导致了信息爆炸的产生,就医个体难以实现对各医院全面真实数据的掌握及横向对比,缺乏对信息价值及有效性的综合评价机制。因此,如何对海量医保数据进行分析,挖掘出隐藏在医保大数据中参保人的就医规律,构建就医行为推荐模型,为就医选择提供可靠参考,避免不必要的就医迁移,进而可为医保资金分配和医疗资源优化调度提供辅助性决策支撑,成为医保领域中一个重要的研究问题。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:目前,医保领域中传统的推荐方法主要分两个步骤:(1)计算患者之间的相似性;(2)根据相似度以及患者历史就医行为给患者生成推荐列表。基于医保数据,许多相似性学习方法被提出。然而,这些方法没有考虑就医序列之间时间信息的影响。近年来,随着医保信息
的推进,深度学习方法已被广泛采用并在患者相似学习中迅速发展,例如自动编码器,递归神经网络(RecurrentNeuralNetwork,RNN),长短期记忆神经网络(LSTM,LongShort-TermMemory)和卷积神经网络(ConvolutionalNeuralNetwork,CNN)。在过去的研究中,专利技术者发现,在数据降维和特征向量的连续性表示方面,CNN要优于RNN和LSTM,并且CNN也已经被证明了它在度量患者相似性方面的卓越能力。然而,CNN框架却忽略了高维医保数据对患者之间相似性学习的影响。因此,如何利用具有高维时间特性的医保数据进行相似性学习具有很大的挑战。在真实的医保领域中,大部分数据集的分布是不平衡的,即一些类比其他类有更多的实例,数据集的不平衡度可能达到10:1、100:1,甚至1000:1,这种情况下少数类的数据分布规律信息往往难以被充分表达。大多数的数据不平衡处理算法通过学习边界样本的分布趋势实现样本分类,因为在边界上的样本更容易被错分。如Borderline-SMOTE算法对边界的少数类样本采用SMOTE算法随机添加实例。然而,该算法却没有对边界实例分配权重。针对上述提出的问题和挑战,旨在解决以下几个关键性问题:对于分布不平衡的医保数据,如何进行数据不平衡处理,从而达到更优的数据特征分布规律提取;针对具有时间属性和高维特征的医保数据,如何进行就医样本相似性范围的度量学习,并根据高相似样本集实现就医资源匹配综合评价,进而为就医迁移提供参考依据。
技术实现思路
为了解决现有技术的不足,本公开提供了基于相似性学习的就医迁移方案推荐方法及系统;采用自适应边界采样算法(AdaptiveBorderline-SMOTE,AB-SMOTE)对医保数据进行数据不平衡处理,生成新的训练数据集。为了验证患者是否需要发生就医迁移行为,即去参保统筹地区以外的医院就医。本专利在CNN模型的基础上,引入一个匹配矩阵构建一个相似性学习框架,在发生就医迁移和未发生就医迁移的人群中,找到与患者就医行为样本相似的样本。然后根据历史就医数据分别对相似样本进行CNN处理,得到相似样本的特征表示向量。基于相似样本的特征表示向量,采用注意力机制更新特征向量中各个特征对医院就医状态数据的权重值,并获得影响就医状态的综合特征向量。最后,利用就医状态的综合特征向量,并通过softmax函数输出所在地区治疗该类疾病的平均治疗效果,通过治疗效果对比给予患者就医迁移的建议。第一方面,本公开提供了基于相似性学习的就医迁移方案推荐方法;基于相似性学习的就医迁移方案推荐方法,包括:训练阶段和应用阶段;所述训练阶段,包括:获取所有医保人员的历史就医数据,基于获取的数据训练出就医迁移方案推荐模型;所述应用阶段,包括:基于就医迁移方案推荐模型,为待推荐患者推荐出不同就医迁移方案的推荐比例。第二方面,本公开还提供了基于相似性学习的就医迁移方案推荐系统;基于相似性学习的就医迁移方案推荐系统,包括:训练模块和应用模块;所述训练模块,其被配置为:获取所有医保人员的历史就医数据,基于获取的数据训练出就医迁移方案推荐模型;所述应用模块,其被配置为:基于就医迁移方案推荐模型,为待推荐患者推荐出不同就医迁移方案的推荐比例。第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。与现有技术相比,本公开的有益效果是:(1)本公开通过对近年来就医行为数据的分析,采用AB-SMOTE算法对历史就医数据进行不平衡处理,基于就医样本数据的分布规律,以原始数据分布密度对少数类样本进行采样扩充,保障维持原有样本数据分布规律的同时,降低后续CNN相似性学习框架的调参难度,避免由于样本数据量过少而难以拟合样本相似分布规律;(2)本公开以历史医保数据为基础,由于就医记录往往时间跨度大、信息阶段性显著及高维数据密度分布不均衡,CNN算法可基于部分时序信息识别整体就医规律,识别不受时间范围的影响,且以卷积缩放高维特征数据的同时,不改变就医记录的规律分布,故采用CNN算法构建相似性学习框架实现对相似人群分布规律的捕获,从而提高就医样本相似性聚类的精确性;(3)本公开针对具有高维时间特性的就医序列,采用CNN算法实现对高相似历史就医样本集综合特征的提取,并基于历史就医记录对各医院不同疾病的就医等待时间、治疗时间、实际治疗费用、治疗效果等进行综合评价,通过注意力机制更新就医样本中综合特征权重,并采用softmax函数实现个性化的就医匹配,提供就医选择推荐意见,保障就医需求得到满足的同时,避免不必要的就医迁移行为发生,有利于医疗资源的均衡利用。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本公开实施例一提供的就医迁移推荐方法的整体流程图;图2为本公开实施例一提供的基于AB-SMOTE算法的数据不平衡处理流程图;图3为本公开实施例一提供的以CNN为核心的患者相似性学习的数据流处理过程图;图4为本公开实施例一提供的基于CNN和注意力机制的就医迁移行为推荐的处理流程图;图5为本公开实施例一提供的就行迁移行为推荐实施例流程图。...

【技术保护点】
1.基于相似性学习的就医迁移方案推荐方法,其特征是,包括:训练阶段和应用阶段;/n所述训练阶段,包括:获取所有医保人员的历史就医数据,基于获取的数据训练出就医迁移方案推荐模型;/n所述应用阶段,包括:基于就医迁移方案推荐模型,为待推荐患者推荐出不同就医迁移方案的推荐比例。/n

【技术特征摘要】
1.基于相似性学习的就医迁移方案推荐方法,其特征是,包括:训练阶段和应用阶段;
所述训练阶段,包括:获取所有医保人员的历史就医数据,基于获取的数据训练出就医迁移方案推荐模型;
所述应用阶段,包括:基于就医迁移方案推荐模型,为待推荐患者推荐出不同就医迁移方案的推荐比例。


2.如权利要求1所述的方法,其特征是,所述训练阶段,包括:S1-S7;
S1:从医保数据中获取所有医保人员的历史就医数据;
S2:对所获取的历史就医数据进行不平衡处理,从而获得训练集;
S3:从训练集输入到第一卷积神经网络CNN中,输出若干个相似患者群,每个相似患者群均包括若干个相似患者;
S4:对每个相似患者群中的每个相似患者的历史就医数据利用第二卷积神经网络CNN进行特征提取,得到每个相似患者群中每个相似患者的特征表示向量;
S5:对每个相似患者群中每个相似患者的特征表示向量,采用注意力机制更新特征表示向量中各个特征值的权重值,对各个特征值进行加权求和,得到每个相似患者群中每个相似患者的综合特征向量;
S6:将每个相似患者群中每个相似患者的综合特征向量,输入到softmax函数中,输出每个相似患者的转到不同家医院或不建议转院的推荐比例值;
S7:计算softmax函数输出值的损失函数,采用反向传播算法训练第二卷积神经网络CNN的学习参数,完成第二卷积神经网络CNN的训练。


3.如权利要求1所述的方法,其特征是,所述应用阶段,包括:S8-S11;
S8:获取待推荐患者的就医数据,将待推荐患者的就医数据和训练集输入到第一卷积神经网络CNN中,输出待推荐患者的相似患者群;
S9:将待推荐患者的相似患者群中的每个相似患者的历史就医数据利用训练好的第二卷积神经网络CNN进行特征提取,得到待推荐患者的相似患者群中每个相似患者的特征表示向量;
S10:对待推荐患者的相似患者群中每个相似患者的特征表示向量,采用注意力机制更新特征表示向量中各个特征值的权重值,对各个特征值进行加权求和,得到待推荐患者的相似患者群中每个相似患者的综合特征向量;
S11:将待推荐患者的相似患者群中每个相似患者的综合特征向量,输入到softmax函数中,输出待推荐患者的转到不同家医院推荐比例值或不建议转院的推荐比例值。


4.如权利要求2所述的方法,其特征是,
所述S2中,对所获取的历史就医数据进行不平衡处理,从而获得训练集;其中不均衡处理是利用自适应边界采样算法AB-SMOTE算法来实现;
或者,
所述S3中,第一卷积神经网络CNN为改进型卷积神经网络;所述第一卷积神经网络CNN,包括:并列的两条支线;
第一条支线,包括:第一输入层、第一卷积层、第一池化层、第一加权汇总层和第一向量表示层;
第二条支线,包括:第二输入层、第二卷积层、第二池化层、第二加权汇总层和第二向量表示层;
所述第一向量表示层的第一输出值和第二向量表示层的第二输出值均输入到匹配矩阵中,匹配矩阵输出第一输出值和第二输出值的相似性表示;
将第一输出值和第二输出值的相似性表示,输入到softmax函数中,softmax函数输出相似度;将相似度大于设定阈值的患者归为一类;
其中,第一输入层,用于输入患者A的患者数据;第一卷积层用于对患者A的患者数据进行特征提取;第一池化层用于对特征提取的结果进行池化处理;第一加权汇总层用于对池化层输出的结果进行加权求和;第一向量表示层用于对加权求和后的结果进行表示;
其中,第二输入层,用于输入患者B的患者数据;第二卷积层用于对患者B的患者数据进行特征提取;第二池化层用于对特征提取的结果进行池化处理;第二加权汇总层用于对池化层输出的结果进行加权求和;第二向量表示层用于对加权求和后的结果进行表示;
其中,匹配矩阵是指一个m行n列的对称矩阵,它用于转换患者A和患者B的相似度向量。


5.如权利要求2所述的方法,其特征是,所述S5的步骤包括:
基于利用相似人群的特征表示向量Wc,结合社保系统传输的各医院就医分布数据概率统计获取相似人群的综合特征表示H,采用注意力Attention机制更新各个特征的权重值,即:
ut=tanh(wHt+b)(8)



δ=∑tatHt(10)
其中,w∈RL×|C|和b∈RL分别表示权重矩阵和基本矩阵,L为医院数量,C为疾病类别,ut代表医院-特征的关注性向量,T表示t时刻生成的各医院...

【专利技术属性】
技术研发人员:史玉良程林管永明张晖吕梁姜诚
申请(专利权)人:山大地纬软件股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1