一种基于制造技术

技术编号:39494814 阅读:7 留言:0更新日期:2023-11-24 11:21
本发明专利技术涉及推荐系统隐私安全领域,具体讲是设计一种基于

【技术实现步骤摘要】
一种基于BGV同态加密的密文训练方法


[0001]本专利技术涉及推荐系统隐私安全领域,具体讲是设计一种基于
BGV
同态加密的密文训练方法


技术介绍

[0002]基于
GNN
的会话推荐是一种使用图神经网络
(GNN)
技术进行个性化会话推荐的方法;传统的个性化推荐系统通常基于用户的历史行为和兴趣来生成推荐结果,但对于会话数据这种包含时间顺序和交互关系的数据,传统方法往往难以捕捉到其特点;
GNN
作为一种专门用于处理图结构数据的机器学习模型,能够捕捉节点之间的关系和依赖;在基于
GNN
的会话推荐中,用户的会话可以被建模为一个图,其中节点表示不同的项目或行为,边表示不同的交互关系,如点击

购买等;通过
GNN
的学习和推断,可以从会话图中提取有关用户兴趣和行为模式的特征,从而进行个性化的会话推荐;然而,目前现有的会话推荐方案都没有考虑到用户的隐私保护问题,可能会造成用户隐私泄露的问题,为用户造成不必要的麻烦

[0003]BGV
同态加密是一种特殊的同态加密技术,能够在保持数据加密的同时进行计算操作,尤其在多项式加密方面具有重要应用;传统的加密系统通常需要先解密数据,然后进行计算,最后再加密结果,这可能导致安全性问题和数据泄露的风险;而
BGV
同态加密方案通过使用一种特殊的加密算法,使得在加密状态下进行多项式计算成为可能;在
BGV/>同态加密中,多项式可以被加密为同态密文,并且可以在同态密文上执行加法和乘法等同态运算,而不需要解密密文;这意味着,通过
BGV
同态加密方案,可以在保持数据加密的同时对多项式进行计算,提供了一种安全且实用的解决方案;该技术对于保护隐私数据和在安全环境下进行计算具有重要意义,特别是在云计算

数据隐私保护和安全计算领域


技术实现思路

[0004]为了克服上述会话推荐方法的缺陷,本专利技术提供了一种基于
BGV
同态加密的密文训练方法

[0005]本专利技术解决其技术问题所采用的技术方案是:一种基于
BGV
同态加密的密文训练方法,包括以下步骤:
[0006]1)
首先,对电商数据集中的会话序列进行预处理操作:
[0007]1.1)
过滤掉所有会话长度和项出现次数不符合要求的项;
[0008]1.2)
利用分割的技术对数据进行扩增
(
得到更大的数据集
)

[0009]2)
对会话序列进行加密:
[0010]2.1)
参数生成
ParamGen(
λ
,
μ
,b)

(para)

[0011]2.2)
私钥生成
PrivateKeyGen(q,d,n,N,X)

sk

[0012]2.3)
公钥生成
PubKeyGen(q,d,n,N,X,sk)

pk

[0013]2.3)
加密过程
Encrypt(m,pk,q,d,n,N,X)

c

[0014]3)
通过近似激活函数,得到可同态训练的密文训练模型:
[0015]3.1)
用自适应泰勒展开式去近似神经网络训练模型中的激活函数;
[0016]3.2)
对用到的激活函数进行自适应泰勒展开式近似;
[0017]3.3)
得到支持同态训练的密文训练模型;
[0018]4)
对密文进行密文训练:
[0019]4.1)
将神经网络的权重和偏置转换为密文形式,构建密文网络;
[0020]4.2)
在激活函数加密的基础上,在多层神经网络中,进行密文前向传播;
[0021]4.3)
对密文输出结果解密成明文,并进行损失函数计算与加密,然后参与密文反向传播和梯度更新;
[0022]5)
对密文训练结果进行解密:
[0023]5.1)
解密过程
Decrypt(c,q,d,n,N,X,sk)

m

[0024]5.2)
客户端得到明文形式的推荐结果向量,并从中提取系数,于是得到会话推荐的结果

[0025]与现有的技术相比,本专利技术的有益效果是技巧性地将会话推荐的序列与
BGV
同态加密明文的多项式特性相匹配,同时采用自适应泰勒展开式近似激活函数,得到可同态训练的密文训练模型,然后使用密文训练方法,使服务器对密文进行神经网络训练,最后,对密文训练结果进行解密,得到推荐结果;本专利技术在实现安全性的前提下,获得了比较好的推荐效果,有效地解决电商在为用户进行会话推荐时,产生的用户隐私泄露的问题

附图说明
[0026]下面结合附图及实施例对本专利技术作进一步说明,附图中:
[0027]图1同态加密下的推荐系统;
[0028]图2会话序列同态加解密;
[0029]图3基于
GNN
的会话推荐不同因子的推荐效果

具体实施方式
[0030]本专利技术实施方式包含以下三个步骤:
[0031]为了让用户的会话序列不被泄露,在将会话序列传送给机器学习模型之前先对它们进行
BGV
同态加密,再进行密文训练,并在获得预测结果的密文形式后,再对应解密,进而为用户进行推荐;这样做,不仅让用户得到了有效的推荐,还让用户的隐私得到了保护;
[0032]基于
BGV
同态加密的密文训练方法具体流程:
[0033]电子商城
(
客户端
)
拥有用户的所有互动商品的会话序列,
[0034]首先,对从电商得到的会话序列进行预处理,通过筛选和扩增,将会话序列转换成可
BGV
同态加密的明文向量;
[0035]接着,对明文向量进行同态加密,生成密文向量;
[0036]然后,通过采用自适应泰勒展开式近似激活函数,得到可同态训练的密文训练模型;
[0037]再次,使用密文训练方法,使服务器对密文进行神经网络训练;
[0038]最后,对向量预测结果进行解密,得到用户的每一项商品的预测值,及推荐结果;
[0039]这样做,有效地解决电商在为用户进行会话推荐时,产生的用户隐私泄露的问题

[0040](1)
会话序列的加密
[0041]首先,对电商数据集中的会话序列进行预处理操作,包括筛选和扩增预处理:<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1. 一种基于
BGV
同态加密的密文训练方法,其特征在于:(1)会话序列的预处理首先,对电商数据集的会话序列进行预处理操作,包括筛选和扩增预处理:(
1.1
)筛选通过统计每个会话序列的长度和每个商品项的出现次数,过滤掉所有会话中会话长度是1和项出现的次数小于5次的会话;(
1.2
)扩增利用分割的技术对数据进行扩增(得到更大的数据集);对于一个较长的会话序列,每次去掉会话序列的最后一项,并将其加入会话序列集中,重复这个操作,直到会话序列为:;于是,得到多个形如的会话序列向量,作为
BGV
加密的明文;(2)会话序列的加密(
2.1
)参数生成
2.
输入安全参数和,以及一个比特,得到系统公共参数;(
2.2
)私钥生成
3.
输入系统参数,生成一个向量,并且它的每个元素服从分布抽样;于是得到私钥;(
2.3
)公钥生成
4.
输入系统参数和私钥,随机生成一个矩阵和一个向量,并且向量的每个元素服从分布抽样;将矩阵与向量相乘,再加上向量,得到向量,向量右连接矩阵,得到矩阵,作为用户的公钥;(
2.4
)加密过程
5.
输入参数中为明文消息,为公钥,已知明文向量,随机生成一个向量,并且它的每个元素随机取0或1,将公钥矩阵进行转置,并与向量相乘,得到的结果与明文向量相加,得到密文;(3)通过近似激活函数,得到可同态训练的密文训练模型(
3.1
)用如下自适应泰勒展开式去近似神经网络训练模型中的激活函数:(
a
)定义误差度量确定一个衡量近似误差的度量指标:均方误差(
MSE
),去度量原始函数与展开式之间的差异;(
b
)设置初始阶数大部分激活函数展开式都是从零阶和一阶开始,于是选择零阶作为起点,以便在误差容忍度内快速获得一个近似结果;(
c
)进行展开计算
使用初始阶数对激活函数进行展开计算,并得到近似的展开式;(
d
)评估误差计算近似展开式与原始函数之间的误差;使用步骤1中定义的误差度量指标来衡量两者之间的差异;(
e
)判断误差根据步骤(
d
)中计算得到的误差,判断是否满足设定的误差容忍度;如果误差小于容忍度,认为近似已经足够,停止展开计算;否则,继续下一步;(
f
)增加展开阶数增加展开阶数,重新计算...

【专利技术属性】
技术研发人员:李凤银刘洪哲王萍于喜龙周挥宇
申请(专利权)人:曲阜师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1