一种机器学习服务系统中保护隐私的方法技术方案

技术编号：21454422 阅读：21 留言：0更新日期：2019-06-26 04:56

本发明专利技术公开了一种机器学习服务系统中保护隐私的方法，包括：步骤1，学习和表达原始数据：将高维的原始数据用低维本征空间表达；步骤2，学习和表达攻击者数据：将所有具有高概率分类结果的查询数据用低维本征空间表达作为攻击者数据；步骤3，比较和判断是否回答当前查询：比较所述攻击者数据与原始数据的相似度，如果相似度大于预设的阈值，确认回答当前查询会泄露隐私，则拒绝回答当前查询，否则允许回答当前查询。该方法能保护由于多次查询带来的隐私问题，可以通过对攻击者的知识进行学习建模，进而决定回答或是拒绝回答查询服务，解决了由于过度查询带来的机器学习查询服务隐私问题，由于在方法不改变模型本身，不影响服务质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种机器学习服务系统中保护隐私的方法
本专利技术涉及机器学习的数据隐私保护领域，尤其涉及一种机器学习服务系统中保护隐私的方法。
技术介绍
随着机器学习的快速发展和成熟，机器学习为生活以及很多领域带来便利。得利于深度学习，很多大企业如亚马逊、谷歌和百度等都致力于发展基于深度学习建立的服务系统。用户可以将建立模型这样复杂的任务交给拥有很强计算能力和存储能力的服务平台，或是向平台提出查询服务，一个简单的例子是：通过平台API查询某张图片获悉其对应的分类。但同时，这种服务系统带来了一系列的隐私和安全问题，因为神经网络模型往往是由敏感数据集训练而成，模型本身也是具有商业价值，需要被保护。特别是，随着机器学习的广泛应用，除了互联网巨公司都提供机器学习服务，大部分移动设备都具有GPU和很强的计算能力，这些配置为在移动设备训练模型提供可能，未来的发展中，移动设备也可以作为服务平台，提供模型查询服务。而目前这类问题并没有成熟的解决方案或是尝试。现有的一些技术为保护训练数据和模型对模型和数据进行加密。也有一些技术基于差分隐私，对数据加躁想达到保护隐私的目的，然而，目前已证实了差分隐私在机器学习中不能起到很好的隐私保护的作用，并且此类方法改变了模型，影响机器学习服务的质量，使得返回的查询结果可能出现错误。
技术实现思路
基于现有技术所存在的问题，本专利技术的目的是提供一种机器学习服务系统中保护隐私的方法，能在使用机器学习服务的同时可以保护数据隐私和模型安全，避免由于多次查询带来的隐私泄露的问题。本专利技术的目的是通过以下技术方案实现的：本专利技术实施例提供一种机器学习服务系统中保护...

【技术保护点】
1.一种机器学习服务系统中保护隐私的方法，其特征在于，包括：步骤1，学习和表达原始数据：将高维的原始数据用低维本征空间表达；步骤2，学习和表达攻击者数据：将所有具有高概率分类结果的查询数据用低维本征空间表达作为攻击者数据；步骤3，比较和判断是否回答当前查询：比较所述攻击者数据与原始数据的相似度，如果相似度大于预设的阈值，确认回答当前查询会泄露隐私，则拒绝回答当前查询，否则允许回答当前查询。

【技术特征摘要】
1.一种机器学习服务系统中保护隐私的方法，其特征在于，包括：步骤1，学习和表达原始数据：将高维的原始数据用低维本征空间表达；步骤2，学习和表达攻击者数据：将所有具有高概率分类结果的查询数据用低维本征空间表达作为攻击者数据；步骤3，比较和判断是否回答当前查询：比较所述攻击者数据与原始数据的相似度，如果相似度大于预设的阈值，确认回答当前查询会泄露隐私，则拒绝回答当前查询，否则允许回答当前查询。2.根据权利要求1所述的机器学习服务系统中保护隐私的方法，其特征在于，所述方法的步骤1中，将高维的原始数据用低维本征空间表达为：将高维的原始数据用Manifold去低维的本征空间表达。3.根据权利要求2所述的机器学习服务系统中保护隐私的方法，其特征在于，所述方法的步骤1中，用Manifold去低维的本征空间表达高维的原始数据时，用几何特征对二维或三维的Manifold进行刻画；并用拓扑特征对不能刻画的Manifold细节进行刻画。4.根据权利要求3所述的机器学习服务系统中保护隐私的方法，其特征在于，所述用几何特征对二维或三维的Manifold进行刻画为：用圆或球对二维或三维的Manifold进行刻画；所述用拓扑特征对不能刻画的Manifold细节进行刻画为：用GS-score刻画不能...

【专利技术属性】
技术研发人员：李向阳，侯嘉慧，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人