一种基于数据隐私保护的精准营销系统技术方案

技术编号：25758187 阅读：17 留言：0更新日期：2020-09-25 21:06

本发明专利技术公开了一种基于数据隐私保护的精准营销系统，用于解决现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型，导致不能准确的对客户精准营销的问题；包括数据采集模块、数据分析模块、构建模型模块和模型预测模块；所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块；本发明专利技术银行侧和运营商侧分别计算所有用户在各自事件下偏好度为空的值并填充，并将偏好度靠前的产品推荐给用户；通过结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全的模型，从而对客户进行精准营销，增加客户粘性和满意度，进而促使营业收入增长。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据隐私保护的精准营销系统
本专利技术涉及精准营销系统，具体为一种基于数据隐私保护的精准营销系统。
技术介绍
数据隐私保护是通过联邦学习来实现的，其中联邦学习的设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下，在多参与方或多计算结点之间开展高效率的机器学习。联邦学习分为横向联邦学习和纵向联邦学习，本文用到的是纵向联邦学习。纵向联邦学习适用于两个数据集共享相同的样本ID空间但特征空间不同的情况。纵向联邦学习是聚合这些不同特征并以保护隐私的方式计算训练损失和梯度的过程，以利用双方的数据共同构建模型。推荐业务的原则是以客户为中心，一切从客户需求出发，所以需要先挖掘需求、发现需求、创造需求；现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型，导致不能准确的对客户精准营销的问题。
技术实现思路
本专利技术的目的就在于为了解决现有的营销系统存在不能结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全模型，导致不能准确的对客户精准营销的问题，而提出一种基于数据隐私保护的精准营销系统；本专利技术银行侧和运营商侧分别计算所有用户在各自事件下偏好度为空的值并填充，并将偏好度靠前的产品推荐给用户；通过结合运营商和银行侧用户偏好数据构建用户内容偏好画像补全的模型，从而对客户进行精准营销，增加客户粘性和满意度，进而促使营业收入增长。本专利技术的目的可以通过以下技术方案实现：一种基于数据隐私保护的精准营销系统，包括数据采集...

【技术保护点】
1.一种基于数据隐私保护的精准营销系统，其特征在于，包括数据采集模块、数据分析模块、构建模型模块和模型预测模块；/n所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块；/n所述数据分析模块用于对银行侧和运营商侧的数据进行异常值处理，当数据出现异常值则将整行记录删除；数据分析模块将加工处理后的银行侧和运营商侧的数据发送至构建模型模块；/n所述构建模型模块用于对银行侧和运营商侧的数据进行模型构建处理，具体处理步骤为：/nS1：合并双方用户id；具体为：银行侧与运营商侧分别将本方的用户id发送给对方，两方分别求用户id的并集；/nS2：求双方评分数据的平均值；具体为：银行侧与运营商侧分别计算本地的平均评分和样本数并将其计算的本地的平均评分和样本数发送给对方；/nS3：定义并创建模型，具体步骤为：/nS31：银行侧与运营商侧设定好隐向量的维度k；/nS32：定义变量的初始化方法及各个参数的正则化参数；具体表现为：initializer＝'uniform'：表示初始化方法为：标准正太分布的随机数，变量pu的正则化方法为L2，正则化系数为mu；/nS3...

【技术特征摘要】
1.一种基于数据隐私保护的精准营销系统，其特征在于，包括数据采集模块、数据分析模块、构建模型模块和模型预测模块；
所述数据采集模块用于采集银行侧和运营商侧的数据并将采集的银行侧和运营商侧的数据发送至数据分析模块；
所述数据分析模块用于对银行侧和运营商侧的数据进行异常值处理，当数据出现异常值则将整行记录删除；数据分析模块将加工处理后的银行侧和运营商侧的数据发送至构建模型模块；
所述构建模型模块用于对银行侧和运营商侧的数据进行模型构建处理，具体处理步骤为：
S1：合并双方用户id；具体为：银行侧与运营商侧分别将本方的用户id发送给对方，两方分别求用户id的并集；
S2：求双方评分数据的平均值；具体为：银行侧与运营商侧分别计算本地的平均评分和样本数并将其计算的本地的平均评分和样本数发送给对方；
S3：定义并创建模型，具体步骤为：
S31：银行侧与运营商侧设定好隐向量的维度k；
S32：定义变量的初始化方法及各个参数的正则化参数；具体表现为：initializer＝'uniform'：表示初始化方法为：标准正太分布的随机数，变量pu的正则化方法为L2，正则化系数为mu；
S33：定义模型的层；具体表现为：用户隐向量层pu：一维长度为k的向量，按照初始化方法产生随机数列；依次对事件隐向量层qi、用户偏见层bu和事件偏见层bi进行定义；
S34：创建模型；模型的预测公式为：
其中：Nu表示用户行为记录，包括浏览和评过分的商品集合；yj表示隐藏的评价了物品j的个人喜好偏置，取值为1或0；T表示矩阵转置；u表示全局均值，bu表示用户偏见，bi表示物品偏见；
S4：模型训练；设定好参数，把采集的数据按照batch_size分为不同批次，一批一批的数据按照以下步骤训练，具体为：
S41：本地所有批次数据循环训练；具体为：
S411：计算梯度，令则各个变量的梯度为：

其中，λ表示正则化系数，yi表示用户对项目i的实际评分标签；
S412：权重更新，具体为：通过梯度下降法得到更新后的权重，即变量_更新后＝变量_更新前-gama×该变量的梯度；
S413：双方分别计算本地所有批次数据量的总和，分别为num_g和num_h；
S42：合作训练，更新合作权重；当两方各自所有批次的数据都训练完毕后，再让银行侧和运营商侧合作训练、更新有关用户的权重；具体为：
S421：银行侧和运营商侧分别向第三方加密发送本地更新后的用于聚合的权重aggregate_weights＝{pu、bu}，并且发送...

【专利技术属性】
技术研发人员：吴福全，朱全日，张小花，左杨，刘爽，
申请(专利权)人：安徽迪科数金科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人