数据推送方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:19425425 阅读:20 留言:0更新日期:2018-11-14 10:39
本申请公开了一种数据推送方法、装置、电子设备及计算机可读存储介质,该数据推送方法,包括:获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;基于所述相似度评分推送所述待处理医疗数据。本申请通过上述方案,实现了对待推送数据的有效推送,提高了推送的针对性,提升了推送效率。

【技术实现步骤摘要】
数据推送方法、装置、电子设备及计算机可读存储介质
本申请涉及数据处理
,特别是涉及一种数据推送方法、装置、电子设备及计算机可读存储介质。
技术介绍
在现有技术中,随着医疗技术的发展,医疗水平以及医疗手段也在稳步提升。人们对于健康也是愈发关注,随之而来的医疗相关信息也被更多的推送到每一位用户手中,然而在现有的医疗相关信息推送过程中,均是大面积的撒网式推送,并不会对每一位用户进行针对性的医疗相关信息推送,从而一方面提高了医疗相关信息的推送成本,且无法做到有效的推送,还会造成每一位接收到该推送的医疗相关信息的用户的反感,降低了用户的体验。因此,如何能够根据每一位用户所关心的医疗相关信息进行有效地推送成为了当前亟待解决的技术问题。
技术实现思路
本申请提供数据推送方法、装置、电子设备及计算机可读存储介质,以实现对待推送数据的有效推送,提高推送的针对性,提升推送效率。第一方面,提供了一种数据推送方法,包括:获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;基于所述相似度评分推送所述待处理医疗数据。第二方面,提供了一种数据推送装置,包括:获取单元,用于获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;第一处理单元,用于基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;第二处理单元,用于基于所述相似度评分推送所述待处理医疗数据。第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-10中任一项所述的数据推送方法对应的操作。第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-10中任一项所述的数据推送方法。与现有技术相比,本申请至少具有以下优点:通过获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;并基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;进而基于确定的相似度评分推送待处理医疗数据,实现了对待推送数据的有效推送,提高了推送的针对性,提升了推送效率。附图说明图1是本申请实施例提供的数据推送方法的流程示意图;图2是本申请实施例提供的数据推送方法的具体处理流程示意图;图3是本申请实施例提供的数据推送装置的结构示意图;图4是本申请实施例提供的基于数据推送方法的电子设备的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。如图1所示,为本申请提供的数据推送方法的流程示意图,该方法包括如下步骤:步骤S101,获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量。步骤S102,基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分。步骤S103,基于所述相似度评分推送所述待处理医疗数据。本实施例中,通过获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;并基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;进而基于确定的相似度评分推送待处理医疗数据,实现了对待推送数据的推送,提升了推送效率。基于上述本申请实施例所提供的技术方案,下面以一个具体实施例对该技术方案进行详尽阐释,如图2所示,为本申请实施例提供的数据推送方法的具体处理流程图,该方法包括:步骤S201,获取待处理医疗数据对应的第一多标签分类向量。在本步骤中,对于该第一多标签分类向量的获取,具体通过如下方式:基于第一BI-GRU神经网络对待处理医疗数据进行处理,得到待处理医疗数据对应的第一多标签分类向量。其中,该第一BI-GRU神经网络的训练过程,可以包括:步骤S2011,对各原始医疗数据进行分句,得到对应各原始医疗数据的医疗数据分句。具体地,在对原始医疗数据进行分句之前,还需要进行格式预处理,如删除换行符、删除特定的格式,删除后整理为连续的句子。再对整理得到的连续句子进行切割分句,该切割分句的依据可以包括逗号、句号、分号等符号。步骤S2012,基于Sent2vec方式对各原始医疗数据的医疗数据分句进行处理,得到各医疗数据分句对应的句子向量。其中,基于Sent2vec方式对各原始医疗数据的医疗数据分句进行处理时,还包括:确定各原始医疗数据对应的医疗数据分句的数量是否大于第一预设阈值;若大于,则基于各医疗数据分句所对应的分句名称长度对医疗数据分句的数量进行调整,直至满足所述第一预设阈值;若小于,则在所述句子向量矩阵中补充全零向量,直至满足所述第一预设阈值。具体地,Sent2vec方式具有两种模型,该两种模型的目标函数分别为:其中,Rd表示实数域R上的d维向量空间,θ表示特征参数[θ0,θ1,…,θd],wi∈Rd为对应位置的词,dm∈Rd为句子向量,T表示句中词数量,Jθ表示在参数θ下的目标函数。该算法中,通过梯度上升使Jθ最大,从而可以实现对句子向量的预测。在得到每个分句的句子向量之后,根据句子向量词典,将每个分句结果映射为[句子编号M,句子向量V]序列Vmedicine。步骤S2013,基于各句子向量对第一BI-GRU神经网络进行训练,得到训练后的针对待处理医疗数据的第一BI-GRU神经网络。具体地,使用医疗领域主题词表将每个数据中包含的主题映射为多标签分类向量VT。使用双向GRU神经网络(Bi-GRU)模型将分句向量序列作为输入,使用分标签分类向量V本文档来自技高网
...

【技术保护点】
1.一种数据推送方法,其特征在于,包括:获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;基于所述相似度评分推送所述待处理医疗数据。

【技术特征摘要】
1.一种数据推送方法,其特征在于,包括:获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量;基于第一多标签分类向量和第二多标签分类向量,确定待处理医疗数据与待处理患者数据的相似度评分;基于所述相似度评分推送所述待处理医疗数据。2.如权利要求1所述的方法,其特征在于,所述获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数据对应的第二多标签分类向量,包括:基于第一BI-GRU神经网络对待处理医疗数据进行处理,得到待处理医疗数据对应的第一多标签分类向量;基于第二BI-GRU神经网络对待处理患者数据进行处理,得到待处理患者数据对应的第二多标签分类向量。3.如权利要求2所述的方法,其特征在于,针对待处理医疗数据的第一BI-GRU神经网络的训练过程,包括:对各原始医疗数据进行分句,得到对应各原始医疗数据的医疗数据分句;基于Sent2vec方式对各原始医疗数据的医疗数据分句进行处理,得到各医疗数据分句对应的句子向量;基于各句子向量对第一BI-GRU神经网络进行训练,得到训练后的针对待处理医疗数据的第一BI-GRU神经网络。4.如权利要求3所述的方法,其特征在于,基于Sent2vec方式对各原始医疗数据的医疗数据分句进行处理时,还包括:确定各原始医疗数据对应的医疗数据分句的数量是否大于第一预设阈值;若大于,则基于各医疗数据分句所对应的分句名称长度对医疗数据分句的数量进行调整,直至满足所述第一预设阈值;若小于,则在所述句子向量矩阵中补充全零向量,直至满足所述第一预设阈值。5.如权利要求2所述的方法,其特征在于,针对待处理患者数据的第二BI-GRU神经网络的训练过程,包括:对各原始患者数据进行病历特征提取,得到对应各原始患者数据的病历特征信息;基于Word2vec方式对各原始患者数据的病历特征信息进行处理,得到各病历特征信息对应的病历特征向量;基于各病历特征向量对第二BI-GRU神经网络进行训练,得到训练后的针对待处理患者数据的第二BI-GRU神经网络。6.如权利要求5所述的方法,其特征在于,基于Word2vec方式对各原始患者数据的病历特征信息进行处理时,还包括:确定各原始患者数据对应的病历特征信息的数量是否大于第二预设阈值;若大于,则基于各病历特征信息对应的评分值对病历特征信息的数量进行调整,直至满足所述第二预设阈值;若小于,则在所述病历特征向量矩阵中补充全零向量,直至满足所述第二预设阈值。7.如权利要求6所述的方法,其特征在于,各病历特征信息对应的评分值的获取方式,包括:对各病历特征信息进行评分,得到各病历特征信息对应的评分值;并针对属于特定区域的病例特征信息对应的评分值进行加权处理,得到经加权处理后的评分值。8.如权利要求1-7中任一项所述的方法,其特征在于,待处理医疗数据与待处理患者数据的相似度评分根据如下公式确定:其中,score为待处理医疗数据与待处理患者数据的相似度评分,H为阶跃函数,且pmedicine为第一多标签分类向量,ppatient为第二多标签分类向量,keepthrehold为预设的保留阈值,dim()为计算向量的维度值函数。9.如权利要求1-8中任一项所述的方法,其特征在于,基于所述相似度评分推送所述待处理医疗数据,包括:确定所述相似度评分与预设相似度阈值的大小关系;并在所述相似度评分不小于预设相似度阈值时,推送所述待处理医疗数据。10.如权利要求9所述的方法,其特征在于,通过如下公式确定所述相似度评分与预设相似度阈值的大小关系:push=H(score-pushthrehold)其中,score为待处理医疗数据与待处理患者数据的相似度评分,H为阶跃函数,且pushthrehold为预设相似度阈值。11.一种数据推送装置,其特征在于,包括:获取单元,用于获取待处理医疗数据对应的第一多标签分类向量以及待处理患者数...

【专利技术属性】
技术研发人员:施其明
申请(专利权)人:线粒体北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利