一种基于数据隐私保护的精准营销系统技术方案

技术编号:25758187 阅读:17 留言:0更新日期:2020-09-25 21:06
本发明专利技术公开了一种基于数据隐私保护的精准营销系统,用于解决现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型,导致不能准确的对客户精准营销的问题;包括数据采集模块、数据分析模块、构建模型模块和模型预测模块;所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块;本发明专利技术银行侧和运营商侧分别计算所有用户在各自事件下偏好度为空的值并填充,并将偏好度靠前的产品推荐给用户;通过结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全的模型,从而对客户进行精准营销,增加客户粘性和满意度,进而促使营业收入增长。

【技术实现步骤摘要】
一种基于数据隐私保护的精准营销系统
本专利技术涉及精准营销系统,具体为一种基于数据隐私保护的精准营销系统。
技术介绍
数据隐私保护是通过联邦学习来实现的,其中联邦学习的设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。联邦学习分为横向联邦学习和纵向联邦学习,本文用到的是纵向联邦学习。纵向联邦学习适用于两个数据集共享相同的样本ID空间但特征空间不同的情况。纵向联邦学习是聚合这些不同特征并以保护隐私的方式计算训练损失和梯度的过程,以利用双方的数据共同构建模型。推荐业务的原则是以客户为中心,一切从客户需求出发,所以需要先挖掘需求、发现需求、创造需求;现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型,导致不能准确的对客户精准营销的问题。
技术实现思路
本专利技术的目的就在于为了解决现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型,导致不能准确的对客户精准营销的问题,而提出一种基于数据隐私保护的精准营销系统;本专利技术银行侧和运营商侧分别计算所有用户在各自事件下偏好度为空的值并填充,并将偏好度靠前的产品推荐给用户;通过结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全的模型,从而对客户进行精准营销,增加客户粘性和满意度,进而促使营业收入增长。本专利技术的目的可以通过以下技术方案实现:一种基于数据隐私保护的精准营销系统,包括数据采集模块、数据分析模块、构建模型模块和模型预测模块;所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块;所述数据分析模块用于对银行侧和运营商侧的数据进行异常值处理,并将加工处理后的银行侧和运营商侧的数据发送至构建模型模块;所述构建模型模块用于对银行侧和运营商侧的数据进行模型构建处理,具体处理步骤为:S1:合并双方用户id;具体为:银行侧与运营商侧分别将本方的用户id发送给对方,两方分别求用户id的并集;S2:求双方评分数据的平均值;具体为:银行侧与运营商侧分别计算本地的平均评分和样本数并将其计算的本地的平均评分和样本数发送给对方;S3:定义并创建模型,具体步骤为:S31:银行侧与运营商侧设定好隐向量的维度k;S32:定义变量的初始化方法及各个参数的正则化参数;具体表现为:initializer='uniform':表示初始化方法为:标准正太分布的随机数,变量pu的正则化方法为L2,正则化系数为mu;S33:定义模型的层;具体表现为:用户隐向量层pu:一维长度为k的向量,按照初始化方法产生随机数列;依次对事件隐向量层qi、用户偏见层bu和事件偏见层bi进行定义;S34:创建模型;模型的预测公式为:其中:Nu表示用户行为记录,包括浏览和评过分的商品集合;yj表示隐藏的评价了物品j的个人喜好偏置,取值为1或0;S4:模型训练;设定好参数,把采集的数据按照batch_size分为不同批次,一批一批的数据按照以下步骤训练,具体为:S41:本地所有批次数据循环训练;具体为:S411:计算梯度,令则各个变量的梯度为:S412:权重更新,具体为:通过梯度下降法得到更新后的权重,即变量_更新后=变量_更新前-gama×该变量的梯度;S413:双方分别计算本地所有批次数据量的总和,分别为num_g和num_h;S42:合作训练,更新合作权重;当两方各自所有批次的数据都训练完毕后,再让银行侧和运营商侧合作训练、更新有关用户的权重;具体为:S421:银行侧和运营商侧分别向第三方加密(同态加密)发送本地更新后的用于聚合的权重aggregate_weights={pu、bu},并且发送原始数据量num_g和num_h;其中第三方为银行侧或者运营商侧搭建一个可信的第三方;S422:第三方获取两方加密的权重后,首先进行解密;S423:再聚合,聚合后的权重为:merged_model=(num_g×aggregate_weights_g+num_h×aggregate_weights_h)/(num_g+num_h);S424:向银行侧与运营商侧发送聚合后的权重;S43:计算损失并判断停止条件,具体为:S431:利用公式计算损失及模型评估指标;S432:将损失值加密,并将其和样本量一起发送给第三方;S433:第三方对发送过来的损失解密,并且聚合损失:total_loss=(num_g×loss_g+num_h×loss_h)/(num_g+num_h)S434:判断停止迭代标签;将停止迭代标签分别发送给银行侧和运营商侧;S5:将停止迭代标签分别发送给银行侧和运营商侧;所述模型预测模块用于银行侧和运营商侧通过构建模型模块中的模型分别得到各自事件的权重,并得到了预测函数,银行侧和运营商侧分别计算所有用户在各自事件下偏好度为空的值并填充,并将偏好度靠前的产品推荐给用户;其中,预测函数为模型构建模块中的模型的预测公式。优选的,所述银行侧的数据包括用户理财的偏好数据和信用卡的偏好数据;运营商侧的数据包括用户购物的偏好数据和汽车的偏好数据。优选的,S434中所述的判断停止迭代标签的具体过程为:A1:当事先设置的停止迭代函数用损失值之差计算,即converge_func=’diff’,那么计算本次和上次迭代的损失值之差,即差diff=上次损失pre_loss-本次损失值total_loss,如果算出来的损失值之差小于事先设定好的阈值,那么停止迭代标签is_converged=True,否则等于false;A2:当事先设置的停止迭代函数用损失值的绝对值,即converge_func=’abs’,那么将接收到的损失值的绝对值和事先设定好的阈值进行比较,如果总损失的绝对值小于阈值,那么停止迭代标签is_converged=True,否则等于false;A3:当事先设置的停止迭代函数不等于’diff’,也不等于’abs’,那么计算本次和上次模型权重的差的2-范数,即两个权重向量对应元素之差的平方和再开二次方,A4:当这个差小于阈值,那么停止迭代标签is_converged=True,否则等于false;与现有技术相比,本专利技术的有益效果是:本专利技术数据分析模块对银行侧和运营商侧的数据进行异常值处理,并将加工处理后的银行侧和运营商侧的数据发送至构建模型模块,构建模型模块对银行侧和运营商侧的数据进行模型构建处理,首选合并双方用户id,再求双方评分数据的平均值,然后定义并创建模型,最后对模型训练;再将停止迭代标签分别发送给银行侧和运营商侧;银行侧和运营商侧通过构建模型模块中的模型分别得到各自事件的权重,并得到了预测函数,银行侧和运营商侧分本文档来自技高网...

【技术保护点】
1.一种基于数据隐私保护的精准营销系统,其特征在于,包括数据采集模块、数据分析模块、构建模型模块和模型预测模块;/n所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块;/n所述数据分析模块用于对银行侧和运营商侧的数据进行异常值处理,当数据出现异常值则将整行记录删除;数据分析模块将加工处理后的银行侧和运营商侧的数据发送至构建模型模块;/n所述构建模型模块用于对银行侧和运营商侧的数据进行模型构建处理,具体处理步骤为:/nS1:合并双方用户id;具体为:银行侧与运营商侧分别将本方的用户id发送给对方,两方分别求用户id的并集;/nS2:求双方评分数据的平均值;具体为:银行侧与运营商侧分别计算本地的平均评分和样本数并将其计算的本地的平均评分和样本数发送给对方;/nS3:定义并创建模型,具体步骤为:/nS31:银行侧与运营商侧设定好隐向量的维度k;/nS32:定义变量的初始化方法及各个参数的正则化参数;具体表现为:initializer='uniform':表示初始化方法为:标准正太分布的随机数,变量pu的正则化方法为L2,正则化系数为mu;/nS33:定义模型的层;具体表现为:用户隐向量层p...

【技术特征摘要】
1.一种基于数据隐私保护的精准营销系统,其特征在于,包括数据采集模块、数据分析模块、构建模型模块和模型预测模块;
所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块;
所述数据分析模块用于对银行侧和运营商侧的数据进行异常值处理,当数据出现异常值则将整行记录删除;数据分析模块将加工处理后的银行侧和运营商侧的数据发送至构建模型模块;
所述构建模型模块用于对银行侧和运营商侧的数据进行模型构建处理,具体处理步骤为:
S1:合并双方用户id;具体为:银行侧与运营商侧分别将本方的用户id发送给对方,两方分别求用户id的并集;
S2:求双方评分数据的平均值;具体为:银行侧与运营商侧分别计算本地的平均评分和样本数并将其计算的本地的平均评分和样本数发送给对方;
S3:定义并创建模型,具体步骤为:
S31:银行侧与运营商侧设定好隐向量的维度k;
S32:定义变量的初始化方法及各个参数的正则化参数;具体表现为:initializer='uniform':表示初始化方法为:标准正太分布的随机数,变量pu的正则化方法为L2,正则化系数为mu;
S33:定义模型的层;具体表现为:用户隐向量层pu:一维长度为k的向量,按照初始化方法产生随机数列;依次对事件隐向量层qi、用户偏见层bu和事件偏见层bi进行定义;
S34:创建模型;模型的预测公式为:
其中:Nu表示用户行为记录,包括浏览和评过分的商品集合;yj表示隐藏的评价了物品j的个人喜好偏置,取值为1或0;T表示矩阵转置;u表示全局均值,bu表示用户偏见,bi表示物品偏见;
S4:模型训练;设定好参数,把采集的数据按照batch_size分为不同批次,一批一批的数据按照以下步骤训练,具体为:
S41:本地所有批次数据循环训练;具体为:
S411:计算梯度,令则各个变量的梯度为:















其中,λ表示正则化系数,yi表示用户对项目i的实际评分标签;
S412:权重更新,具体为:通过梯度下降法得到更新后的权重,即变量_更新后=变量_更新前-gama×该变量的梯度;
S413:双方分别计算本地所有批次数据量的总和,分别为num_g和num_h;
S42:合作训练,更新合作权重;当两方各自所有批次的数据都训练完毕后,再让银行侧和运营商侧合作训练、更新有关用户的权重;具体为:
S421:银行侧和运营商侧分别向第三方加密发送本地更新后的用于聚合的权重aggregate_weights={pu、bu},并且发送...

【专利技术属性】
技术研发人员:吴福全朱全日张小花左杨刘爽
申请(专利权)人:安徽迪科数金科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1