基于SVM分类器的隐私保护和数据安全访问的方法技术

技术编号:10512096 阅读:253 留言:0更新日期:2014-10-08 13:27
本发明专利技术公开了一种基于SVM分类器的隐私保护和数据安全访问的方法,该方法不仅能够实现SVM分类器中涉及到的隐私保护,而且还可以实现安全地向外发布SVM分类器,该方法具有较高的安全性,并且可以保护SVM分类器的隐私。该方法能够广泛应用于,与SVM分类器隐私保护并且要求安全的发布SVM分类器参数的相关的很多应用场景。

【技术实现步骤摘要】
基于SVM分类器的隐私保护和数据安全访问的方法
本专利技术涉及信息技术安全领域,特别是涉及一种基于SVM分类器的隐私保护和数 据安全访问的方法。
技术介绍
目前,数据挖掘的一个主要的任务就是,分类,分类算法从已知标签的训练数据集 上学习得到,一个分类模型,即分类器,对以后的未知标签的数据,进行分类,在现如今,数 据挖掘已经被视为是对个人敏感信息的一个威胁,这个隐私问题,已经使人们开始研究数 据挖掘领域的隐私保护问题,不同的分类算法,有不同的隐私保护方案,SVM是目前分类算 法中,一个使用最广泛的分类算法,在SVM隐私保护方面,已经有很多的工作了,然而,目前 SVM的隐私保护问题,有一个问题,还没有被重视,SVM学习得到的分类器中,包含训练数据 的完整实例,从本质上来说,对于一些法律和商业隐私保护的角度来说,SVM的分类模型会 破坏隐私问题,当向外公布分类器时,会显示训练数据集中的个人敏感数据,比如说,HIPAA 法律要求,医疗数据在没有合适的匿名化之前,是禁止对外发布的,因此,在没有隐私保护 的情况下,这就限制了 SVM学习得到的分类器,对外发布的局限性。 假定一个医院或者医疗机构,已经收集了大量的医疗记录数据,该机构,希望利用 这些收集的数据来学习得到一个SVM分类器,使用该SVM分类器,可以预测一个病人是否得 了这个病,由于在训练得到的分类器中包含一些医疗记录数据,如果发布这个分类器,会泄 漏一些病人的敏感数据,虽然,每条记录的标识符字段已经被移除,但是每条记录的实体身 份也可能从准标识符识别出来,比如说,性别,血型,年龄,出生日期和邮政编码,通过这个 例子,主要是说明,如果对外发布训练得到的SVM分类器,会泄漏原始训练数据集中的一些 数据,会涉及到隐私保护问题。 在2011年,Keng-Pei Lin等人提出了一个新的SVM近似算法,提出的新的近似算 法,会对预先训练出来的SVM分类器,之后再对预先得到的SVM分类器进行处理,以此来保 护支持向量的隐私内容,使用近似的方法,得到的SVM分类器,可以在不泄漏支持向量隐私 的情况下,发布SVM,而且这个近似的SVM分类器,和原来的SVM分类器有相近的分类精确 度。 通过保护分类器中的隐私内容,即支持向量,结果得到的保护隐私的分类器,可以 在不泄漏隐私的情况下,对外公布。 具有隐私保护的SVM分类器具有很多的应用场景,可以有广泛的应用,但是,随之 而来的就是,安全地对外即客户请求方,发布服务器方训练得到的具有隐私保护的SVM分 类器。 假定,现在有一个服务的提供方即服务器B,和一个服务的请求方,即客户方A,客 户方A和服务器方B,需要进行通信,服务器方B,首先利用自己的资源,通过训练得到具有 隐私保护的SVM分类器,客户方A,可以向服务器方B,请求服务器方训练得到的具有隐私保 护的SVM分类器。 在一个开放式和分布式的环境下,A和B要进行通信,认证和机密性,就成为需要 考虑的两个主要的问题,基于认证的密钥协商协议是构建安全网络环境的基础,通过认证 密钥协商协议,在通信系统中为通信的参与者提供身份认证,为身份已经确认的参与方之 间建立共享密钥,用来加密传递的消息。 另外,如何保证通信过程中机密信息不泄漏,鉴别信息来源的真实性,确保信息的 完整性和不可抵赖性,就是网络信息安全研究需要研究的问题,网络安全的目标应当满足 : 身份真实性、信息机密性、信息完整性、服务可用性、不可否认性、系统可控性、系统易用性、 可审查性等等,数字签名技术技术是网络安全的重要手段之一,它可以保证信息完整性、鉴 别发送者的身份真实性和不可否认性。 数字签名的特性包括:身份鉴别,可以鉴别心愿的真实性而防止冒充;不可抵赖 性,信源时候不可否认以防止其抵赖;数据完整性保护,低于数据的篡改或重排;一般还使 用加密技术保护信息机密性,以防止截听攻击等等。 作为网络安全的关键技术之一,数字签名在社会生活的各个领域也都有十分广阔 的应用前景。
技术实现思路
本专利技术主要解决的技术问题是提供一种基于SVM分类器的隐私保护和数据安全 访问的方法,不仅使得SVM分类器具有保护隐私即支持向量的目的,而且还使得在对客户 请求方发布具有隐私保护的SVM分类器时,安全的进行传送SVM模型参数。本文档来自技高网
...

【技术保护点】
一种基于SVM分类器的隐私保护和数据安全访问的方法,即服务请求方A向服务提供方B请求得到服务提供方B训练的具有隐私保护的SVM分类器,其特征在于,具体步骤包括:一.密钥协商:A.建立阶段,即在服务提供方B的PKG文件中生成系统的参数和它自己公私钥对:设置p=G,G为素数集合;利用双线性映射获得;在PKG文件中随机的选取两个生成器g和h,且;在PKG文件中设置主人私钥为;设置哈希函数;设置服务请求方A和服务提供方B之间的共享会话密钥为,并设置;设置PKG的公钥是,其中,,;B.密钥生成阶段,即在服务提供方B的PKG文件中为服务请求方A生成密钥:设置服务请求方A的用户名为,用户身份为;在PKG文件中随机生成一个,并且输出一个私钥为其中;面向服务请求方A时,设置,面向服务提供方B时,设置;C.密钥协商阶段,即服务请求方A和服务提供方B,通过隐式的密钥认证,建立一个共享的共享会话密钥,其步骤包括:1.1)设置服务请求方A的用户身份为,设置服务提供方B的用户身份为,服务请求方A选择一个并且计算,然后把发送给服务提供方B;1.2) 服务提供方B选择一个并且计算,然后把发送给服务请求方A;   1.3) 服务请求方A计算下面式子:   1.4) 服务提供方B计算下面式子:  由1.3和1.4中的步骤可知:(1) (2)且式子(1)和式子(2)是相等的,所以得到:即得到服务请求方A和服务提供方B之间的共享会话密钥;二.训练得到具有隐私保护的SVM分类器,即服务提供方B利用训练数据集,训练得到一个初始的SVM分类器,然后再对这个分类器进行变换,得到一个具有隐私保护的SVM分类器:    2.1) 服务提供方B首先利用自己的训练数据集,通过训练得到一个初始的SVM分类器,所述初始的SVM分类器是基于高斯核函数的,它的决策函数的形式为:(1),其中,,核参数,,偏差变量,为任意有理数,为支持向量,是相应的标签,为与支持向量对应的支持变量,表示训练数据集中包含的支持向量的个数,,,,是成本参数,且;2.2)设置高斯核函数,其中,且根据高斯核函数和决策函数(1),得到;将决策函数(1)等价的变换为:(2)2.3)根据式子(2),将变形为:,其中,,并将决策函数(1)变形为:(3);2.4)在决策函数(3)中,得到的无穷级数的表示形式:(4);通过的无穷级数,得到,并将决策函数(3)中的变形为:(5)使得支持向量仅仅出现在式子里;2.5)通过采用单项式特征映射,设置式子(5)中的,其中,表示阶的单项式映射,并将式子(5)变形为:(6)2.6)在(6)式中,设置(7),在每一个中,所有的特征向量被映射到了一个d阶的单项式特征空间;设置(7),将式子(6)和(7)式子代入到式子(5)中,将式子(5)变形为:(8);     再将式子(8)式代入到决策函数(3)中,将决策函数(3)变形为:(9),即得到具有隐私保护的SVM分类器;三.加密,即利用密钥协商中得到的共享会话密钥、对称加密算法和AES加密算法,对步骤二得到的具有隐私保护的SVM分类器中的参数、、和进行加密,得到密文;四.生成数字签名,即服务提供方B对包含参数、、和的明文,生成相应的数字签名;五.发送至客户请求方,即服务提供方B将步骤三中得到的密文和步骤四中得到的明文的数字签名,一起发送给服务请求方A;六.解密,即服务请求方A接收服务提供方B发送来的密文和数字签名,验证数字签名的正确性;当数字签名正确时,获取步骤一中得到的密钥,然后对密文进行解密得到明文。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄刘生怀梦迪胡杰杨威
申请(专利权)人:中国科学技术大学苏州研究院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1