【技术实现步骤摘要】
基于隐私保护的气动力预测方法以及数据挖掘系统
[0001]本专利技术涉及数据挖掘领域。更具体地说,本专利技术涉及一种采用分布式环境进行保护隐私前提下进行回归预测的气动力预测方法以及数据挖掘系统。
技术介绍
[0002]随着大数据的发展,各行各业每时每刻都在产生和存储大量数据,数据的高度集中与共享为组织间的合作与研究提供了极大的便利,与此同时,也增加了隐私信息泄露的风险。数据挖掘是一种极其强大的数据分析工具,它借助各种数据挖掘算法,能够发现数据中潜在有用的知识和规律,甚至能够挖掘出隐藏在数据背后的巨大经济和政治利益。隐私保护数据挖掘是数据挖掘领域的一个研究分支,将数据挖掘技术与隐私保护技术有机地结合起来,融合了数据库、人工智能、模式识别、机器学习等多个领域的知识技术。隐私保护数据挖掘的主要目的是在隐私数据或敏感规则的合理保护前提下,尽可能得到更精确的数据挖掘结果。
[0003]原始数据隐私保护的主要思想是通过预定义的变换来改变原始数据集,并将变换后的数据提供给挖掘者进行数据挖掘。这种思想为隐私保护数据挖掘沿用。因此,如 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于隐私保护的气动力预测方法,其特征在于,包括:步骤一,各参与方,在本地的原数据文件集中通过添加服从正态分布的噪声,得到带有扰动的数据集;步骤二,各参与方根据步骤一计算所得到的本地扰动数据集计算局部非线性核;步骤三,所有参与方均将其计算得到局部非线性核设置为共享,以使其他参与方能够基于共享的局部非线性核计算对应的全局核;步骤四,基于得到的全局核函数求解最优化问题,得到参数的最优解;步骤五,利用步骤四所得到的参数最优解建立预测模型,进行气动力预测。2.如权利要求1所述的基于隐私保护的气动力预测方法,其特征在于,在步骤一中,数据集的获取过程被配置为包括:S10,在针对离散型数据的线性中心支持向量机PSVM中,通过引入核函数以将线性PSVM调整非线性PSVM,并将PSVM调整为能适用于连续性数据的非线性中心支持向量机PSVR;S11,在PSVR中引入随机扰动技术,通过在本地的原始数据集中添加服从正态分布的噪声,得到带有扰动的数据集。3.如权利要求2所述的基于隐私保护的气动力预测方法,其特征在于,在PSVM中引入核函数的方法被配置为包括:S101,在PSVM中定义两类样本的类中心为两类样本的均值,正类和负类分别为X+,和X
‑
,均值记为得到原始最优化问题如下:s.t.(ω
·
x
i
)+b
‑
y
i
≤ε,i=1,2,...l;y
i
‑
(ω
·
x
i
)
‑
b≤ε,i=1,2,...,l;其中X表示输入的样本数据,x
i
表示X的第i个分量,ω表示权值,b表示阈值,ε表示松弛变量,y
i
表示对应的输出值;通过对原始优化问题的变换使得目标函数具有严格凸性,得到对应每类点的中心超平面;引入拉格朗日函数得该优化问题得对偶问题为:s.t.α
i
,β
i
≥0,i=1,2,...,l y
i
∈R其中,α=(α1,α2,
…
,α
l
技术研发人员:吴珏,杨福军,杨雷,张培红,吴晓军,
申请(专利权)人:中国空气动力研究与发展中心计算空气动力研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。