药物推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28060568 阅读:26 留言:0更新日期:2021-04-14 13:37
本发明专利技术提供一种药物推荐方法、装置、电子设备及存储介质。该方法包括:获取目标对象的相关信息;对所述相关信息进行隐私保护预处理;基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息。本发明专利技术的药物推荐方法在准确、可靠的给患者推荐药物的同时,能够有效地保护患者的隐私;能够对不同类型的数据进行合适的隐私保护处理;推荐算法的鲁棒性较强;在不损失太多精度的情况下,更有效地保护患者的隐私。效地保护患者的隐私。效地保护患者的隐私。

【技术实现步骤摘要】
药物推荐方法、装置、电子设备及存储介质


[0001]本专利技术涉及医疗服务推荐领域,尤其涉及一种药物推荐方法、装置、电子设备及存储介质。

技术介绍

[0002]为了针对患者的病情给患者提供准确的药物推荐,医疗推荐系统都需要搜集患者的医疗数据,而且往往越详细的信息越能提供更精确地推荐效果,在系统收集和处理患者数据时的产生隐私风险往往被低估或忽视,导致患者的隐私泄露问题也是很严重,因此采取有效的方法保护药物推荐中用户的隐私很重要。
[0003]为了保护隐私问题,隐私保护算法越来越被更多人关注,如数据匿名技术(又称去识别),数据扰乱,数据加密和访问控制等技术。随着大数据的增多,差分隐私已经引起了学者们的广泛关注,并应用到医疗推荐领域中。
[0004]目前很多对隐私推荐算法的研究中使用用户的评分矩阵进行推荐,在推荐前对数据进行隐私处理时,只针对单一数据类型进行处理,例如使用随机扰动技术对数值型用户数据做处理,然后创建用户评分矩阵,对于药物推荐来说,既包含分类型又包含数值型的数据,需要分类处理,而且分类型数据不能生成用户评分矩阵。
[0005]鉴于此,选择不同的隐私保护技术分开处理数据,并选择鲁棒性较强的推荐算法,同时考虑推荐系统的推理攻击,在不损失太多精度的情况下,更有效地保护患者的隐私是非常必要的。

技术实现思路

[0006]针对现有技术中的问题,本专利技术实施例提供一种药物推荐方法、装置、电子设备及存储介质,用以解决现有技术中的无法对不同类型的数据进行合适的隐私保护处理、推荐算法的鲁棒性较低、精度差、不能有效保护患者的隐私的缺陷,实现在准确、可靠的给患者推荐药物的同时能够有效地保护患者的隐私的效果。
[0007]具体地,本专利技术实施例提供了以下技术方案:
[0008]第一方面,本专利技术实施例提供了一种药物推荐方法,包括:
[0009]获取目标对象的相关信息;
[0010]对所述相关信息进行隐私保护预处理;
[0011]基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息。
[0012]进一步地,所述对所述相关信息进行隐私保护预处理包括:
[0013]确定所述相关信息中的准标识符属性;
[0014]对所述相关信息中的数值型准标识符属性添加随机扰动;
[0015]对所述相关信息中的分类型准标识符属性进行K

匿名处理。
[0016]进一步地,所述基于梯度提升决策树算法的模型包括具有差分隐私保护功能的基
于梯度提升决策树算法的模型。
[0017]进一步地,在对所述相关信息中的数值型准标识符属性添加随机扰动以及对所述相关信息中的分类型准标识符属性进行K

匿名处理之前,所述对所述相关信息进行隐私保护预处理还包括:
[0018]基于患者的人口统计信息、患者的病症属性以及所用药物属性,生成患者

药物矩阵C,
[0019][0020]其中,n表示患者的属性数量,m表示患者数量。
[0021]进一步地,所述对所述相关信息中的数值型准标识符属性添加随机扰动包括:
[0022]确定扰动范围[

γ,γ];
[0023]对所述矩阵C中的数值型准标识符属性添加均匀分布在[

γ,γ]中的随机数。
[0024]进一步地,所述对所述相关信息中的分类型准标识符属性进行K

匿名处理包括:
[0025]步骤1),利用KACA算法对所述相关信息中的分类型准标识符属性做匿名化处理,基于矩阵C生成初始等价类X={x1,x2,x3,

,x
n
},其中,X为等价类集合,x1,x2,x3,

,x
n
为等价类,每个等价类中的各个元组的准标识符的值相等;
[0026]步骤2),选取元组个数小于K的等价类x
i
,计算等价类x
i
和等价类集合X中除等价类x
i
以外的等价类的距离,找到距离x
i
最近的等价类x
j

[0027]如果等价类x
i
和x
j
的共同元组的个数小于K,将等价类x
i
和x
j
合并为一类,并在等价类集合X中删除等价类x
j

[0028]如果等价类x
i
和x
j
的共同元组的个数大于或等于K,在x
j
中选取距离x
i
最近的K

|x
i
|个元组构成等价类x
j1
,将等价类x
i
和x
j1
合并为一类,并在等价类集合X中删除等价类x
j1

[0029]步骤3),循环执行上述的步骤2)若干次,直到等价类集合X中不存在元组个数小于K的等价类,使每个元组都至少和所述等价类中的K

1条记录的准标识符一致;
[0030]步骤4),对等价类集合X中的每个等价类进行泛化处理。
[0031]进一步地,所述方法还包括:
[0032]在对所述矩阵C中的分类型准标识符属性做匿名化处理之后,对满足k匿名的矩阵C的中的分类型准标识符属性进行One

hot编码,形成特征矩阵E。
[0033]进一步地,所述方法还包括:
[0034]训练具有差分隐私保护功能的基于梯度提升决策树算法的模型,所述训练具有差分隐私保护功能的基于梯度提升决策树算法的模型包括:
[0035]将所述特征矩阵E输入至模型中,其中,准标识符属性和患者病症属性作为模型的特征,药物名称作为模型的预测目标;
[0036]利用残差更新迭代求强学习器;
[0037]基于拉普拉斯机制对得到的强学习器进行差分隐私处理。
[0038]进一步地,所述相关信息包括人口统计信息、治疗信息以及药物信息,所述人口统计信息包括所述目标对象的年龄、性别、邮编以及地址,
[0039]其中,所述目标对象的年龄、性别、邮编为数值型准标识符属性,所述目标对象的地址为分类型准标识符属性。
[0040]第二方面,本专利技术提供一种药物推荐装置,包括:
[0041]获取单元,用于获取目标对象的相关信息;
[0042]隐私保护预处理单元,用于对所述相关信息进行隐私保护预处理;
[0043]药物推荐单元,用于基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息。
[0044]第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种药物推荐方法,其特征在于,包括:获取目标对象的相关信息;对所述相关信息进行隐私保护预处理;基于已进行隐私保护预处理的所述相关信息以及基于梯度提升决策树算法的模型来生成针对所述目标对象的药物推荐信息。2.根据权利要求1所述的药物推荐方法,其特征在于,所述对所述相关信息进行隐私保护预处理包括:确定所述相关信息中的准标识符属性;对所述相关信息中的数值型准标识符属性添加随机扰动;对所述相关信息中的分类型准标识符属性进行K

匿名处理。3.根据权利要求1所述的药物推荐方法,其特征在于,所述基于梯度提升决策树算法的模型包括具有差分隐私保护功能的基于梯度提升决策树算法的模型。4.根据权利要求2所述的药物推荐方法,其特征在于,在对所述相关信息中的数值型准标识符属性添加随机扰动以及对所述相关信息中的分类型准标识符属性进行K

匿名处理之前,所述对所述相关信息进行隐私保护预处理还包括:基于患者的人口统计信息、患者的病症属性以及所用药物属性,生成患者

药物矩阵C,其中,n表示患者的属性数量,m表示患者数量。5.根据权利要求4所述的药物推荐方法,其特征在于,所述对所述相关信息中的数值型准标识符属性添加随机扰动包括:确定扰动范围[

γ,γ];对所述矩阵C中的数值型准标识符属性添加均匀分布在[

γ,γ]中的随机数。6.根据权利要求4所述的药物推荐方法,其特征在于,所述对所述相关信息中的分类型准标识符属性进行K

匿名处理包括:步骤1),利用KACA算法对所述相关信息中的分类型准标识符属性做匿名化处理,基于矩阵C生成初始等价类X={x1,x2,x3,

,x
n
},其中,X为等价类集合,x1,x2,x3,

,x
n
为等价类,每个等价类中的各个元组的准标识符的值相等;步骤2),选取元组个数小于K的等价类x
i
,计算等价类x
i
和等价类集合X中除等价类x
i
以外的等价类的距离,找到距离x
i
最近的等价类x
j
;如果等价类x
i
和x
j
的共同元组的个数小于K,将等价类x
i
和x
j
合并为一类,并在等价类集合X中删除等价类x
j
...

【专利技术属性】
技术研发人员:李建强李媛王延安
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1