当前位置: 首页 > 专利查询>青岛大学专利>正文

一种具有隐私性保护的朴素贝叶斯分类方法技术

技术编号:36033420 阅读:17 留言:0更新日期:2022-12-21 10:35
本发明专利技术公开了一种具有隐私性保护的朴素贝叶斯分类方法,包括:基于加密朴素贝叶斯分类模型为用户在云服务器部署分类服务;通过哈希函数将用户需要分类的生物特征向量进行加密,获得加密生物特征向量,并将加密生物特征向量发送至云服务器;云服务器进行数据交互执行朴素贝叶斯分类方案,获得加密分类结果,并将加密分类结果返回给用户,用户解密后获得目标分类结果。本发明专利技术实现了模型的共享,使得没有模型的用户也可以通过共享的模型获得分类结果,既保证用户待分类的输入数据和分类结果的隐私信息不泄露,也保证了模型的隐私性;用户和模型提供者只需要和云服务器交互一次,解放了用户和模型提供者的在线参与。放了用户和模型提供者的在线参与。放了用户和模型提供者的在线参与。

【技术实现步骤摘要】
一种具有隐私性保护的朴素贝叶斯分类方法


[0001]本专利技术属于信息安全
,特别是涉及一种具有隐私性保护 的朴素贝叶斯分类方法。

技术介绍

[0002]随着医疗信息化和数字化诊断的发展,医疗监测指标不断增长, 数据量越来越庞大,亟需强大的数据处理能力为医疗领域提供有力的 支持。机器学习,作为人工智能领域炙手可热的一个分支,在语音识 别和计算机视觉等方面得到飞速发展,在医疗领域的应用越来越广 泛,形成了我国健康医疗产业发展的一个新方向

互联网医疗,健康 监测服务就是其中之一。在机器学习中,分类器被广泛用于探索数据 的相互关系和特征,以解决分类问题。它已被广泛应用于疾病分类检 测等领域。有了训练好的模型,机器学习推理可以自动预测新的输入。 借助云计算服务平台实现模型共享,没有模型的用户也可以使用云上 的共享模型来获得推理结果。由于云计算的许多优势,将此类推理服 务外包到云已经变得越来越流行。
[0003]然而,在现实中几乎不可能找到完全可信的云服务器。因此尽管 云有众所周知的好处,将健康监测服务外包给半信任云也会引起严重 的隐私问题。首先,供应商的模型通常是专有的,因为培训一个有效 的模型需要对数据集、资源和专业技能进行大量投资。提供商自然不 愿意将模型以明文形式公开给云。其次,作为模型输入的客户数据和 推理结果也可能是敏感的,比如医疗数据或财务数据。直接以明文形 式提供输入和输出结果可能很容易侵犯客户的隐私。因此,从一开始 就在推理外包设计中嵌入安全性是必要的,以确保专有模型、敏感客 户数据以及最终分类结果的隐私。
[0004]朴素贝叶斯因为其有效性和易用性成为最流行的分类模型之一。 朴素贝叶斯已经被证明对实际应用非常有用,例如医疗检测分类等。 简单来说,朴素贝叶斯分类是以贝叶斯定理为基础并且假设特征条件 之间相互独立的方法。先通过已给定的训练集,以特征词之间独立作 为前提假设,学习从输入到输出的联合概率分布,再基于学习到的模 型,输入待分类的特征词求出使得后验概率最大的输出。
[0005]常见的用于隐私保护的朴素贝叶斯分类的技术有两种,即同态加 密技术和安全多方计算。不可否认,基于密码学的隐私保护方法具有 很强的隐私性,但通常在效率方面的性能较差,使其在几乎所有应用 中都不切实际。因此,需要既允许朴素贝叶斯分类器提供商在云上为 用户部署分类服务,同时又保护专有模型和用户敏感数据的隐私。研 究如何为健康监测系统实现安全有效的朴素贝叶斯分类具有重要意 义。

技术实现思路

[0006]为实现上述目的,本专利技术提供了如下方案:一种具有隐私性保护 的朴素贝叶斯分类方法,包括:
[0007]基于加密朴素贝叶斯分类模型为用户在云服务器部署分类服务;
[0008]通过哈希函数将用户需要分类的生物特征向量进行加密,获得加 密生物特征向量,并将所述加密生物特征向量发送至所述云服务器;
[0009]所述云服务器进行数据交互执行朴素贝叶斯分类方案,获得加密 分类结果,并将所述加密分类结果返回给用户,用户解密后获得目标 分类结果。
[0010]优选地,所述加密朴素贝叶斯分类模型的获取过程包括,
[0011]获取生物医学数据,构建朴素贝叶斯分类器;
[0012]将所述生物医学数据输入所述朴素贝叶斯分类器进行训练,获得 朴素贝叶斯分类模型;
[0013]基于Setup算法对所述朴素贝叶斯分类模型进行加密,获得所述 加密朴素贝叶斯分类模型。
[0014]优选地,基于加密朴素贝叶斯分类模型为用户在云服务器部署分 类服务的过程包括,
[0015]获得所述生物医学数据的特征向量,基于所述特征向量计算属于 各个类别的概率值;将所述概率值以秘密共享的形式保存在类条件概 率表格、先验概率表格中。
[0016]优选地,基于所述特征向量计算属于各个类别的概率值的过程包 括,
[0017]计算特征向量属于各个类别的后验概率并对各个类别的后验概 率进行比较,获得最大后验概率;取最大后验概率的类别作为所述特 征向量的所属类别。
[0018]优选地,所述后验概率P(Y|X)基于先验概率P(Y)、证据P (X)和类条件概率P(X|Y)计算获得,表达式为:
[0019][0020]优选地,将所述概率值以秘密共享的形式进行保存的过程包括,
[0021]加法秘密共享通过在环上将向量x按照加法分割成<x>0和<x>1来保护l位的秘密值x,满足<x>0+<x>1≡x(mod2
l
);每个单独的秘密份 额是均匀分布在环上的随机值,给定两个秘密值x和y的秘密份 额,云服务器分别持有<x>
m
和<y>
m
,m∈{0,1};加法秘密共享支持秘 密共享域中的加/减法<z>
m
=<x>
m
±
<y>
m

[0022]优选地,通过哈希函数将用户需要分类的生物特征向量进行加 密,获得加密生物特征向量,并将所述加密生物特征向量发送至云服 务器的过程包括,
[0023]基于哈希函数加密生物特征向量、向量维度以及分类的类别数, 基于伪随机置换函数加密所述生物特征向量分类的类别数,获得加密 生物特征向量;
[0024]输入需要分类的加密生物特征向量V={v1,v2,...,v
d
},基于TokenGen 算法输出用户查询令牌TK={TK1,TK2,...,TK
t
},并将用户查询令牌TK发 送至两个云服务器;其中,TK
i
包括含有d个元素的字符串向量数值
[0025]优选地,所述云服务器进行数据交互执行朴素贝叶斯分类方案, 获得加密分类结果,并将所述加密分类结果返回给用户,用户解密后 获得目标分类结果的过程包括,
[0026]所述云服务器基于先验概率表格、类条件概率表格以及用户查询 令牌,计算获得各个类别对应的后验概率的秘密份额后两服务器进行 交互,使用并行前缀加法器在加法秘密共享域上恢复各个类对应的后 验概率并作差,然后根据安全提取差的最高有效位来
判断后验概率的 大小;最后将后验概率最大的对应的令牌返回给用户,用户根据伪随 机置换函数的逆函数获得所述分类结果。
[0027]本专利技术公开了以下技术效果:
[0028]本专利技术提供的一种具有隐私性保护的朴素贝叶斯分类方法,朴素 贝叶斯分类器提供商在云服务器上为用户部署分类服务,用户将需要 分类的生物特征向量发送给云服务器。两个云服务器进行交互,安全 地执行朴素贝叶斯分类方案,得出分类结果,返回给用户。实现了模 型的共享,使得没有模型的用户也可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具有隐私性保护的朴素贝叶斯分类方法,其特征在于,包括:基于加密朴素贝叶斯分类模型为用户在云服务器部署分类服务;通过哈希函数将用户需要分类的生物特征向量进行加密,获得加密生物特征向量,并将所述加密生物特征向量发送至所述云服务器;所述云服务器进行数据交互执行朴素贝叶斯分类方案,获得加密分类结果,并将所述加密分类结果返回给用户,用户解密后获得目标分类结果。2.根据权利要求1所述的一种具有隐私性保护的朴素贝叶斯分类系统,其特征在于,所述加密朴素贝叶斯分类模型的获取过程包括,获取生物医学数据,构建朴素贝叶斯分类器;将所述生物医学数据输入所述朴素贝叶斯分类器进行训练,获得朴素贝叶斯分类模型;基于Setup算法对所述朴素贝叶斯分类模型进行加密,获得所述加密朴素贝叶斯分类模型。3.根据权利要求1所述的一种具有隐私性保护的朴素贝叶斯分类系统,其特征在于,基于加密朴素贝叶斯分类模型为用户在云服务器部署分类服务的过程包括,获得所述生物医学数据的特征向量,基于所述特征向量计算属于各个类别的概率值;将所述概率值以秘密共享的形式保存在类条件概率表格、先验概率表格中。4.根据权利要求3所述的一种具有隐私性保护的朴素贝叶斯分类系统,其特征在于,基于所述特征向量计算属于各个类别的概率值的过程包括,计算特征向量属于各个类别的后验概率并对各个类别的后验概率进行比较,获得最大后验概率;取最大后验概率的类别作为所述特征向量的所属类别。5.根据权利要求4所述的一种具有隐私性保护的朴素贝叶斯分类系统,其特征在于,所述后验概率P(Y|X)基于先验概率P(Y)、证据P(X)和类条件概率P(X|Y)计算获得,表达式为:6.根据权利要求3所述的一种具有隐私性保护的朴素贝叶斯分类系统,其特征在于,将所述概率值以秘密共享的形式进行保存的过程包括,加法秘密共享通过在环Z2
l
上将向量x按照加法分割成<x>0和<x>1来保护1位的秘密值x,满足<x>0+<x>1≡x(...

【专利技术属性】
技术研发人员:于佳郭丽郝蓉
申请(专利权)人:青岛大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1