【技术实现步骤摘要】
数据处理方法及相关装置
[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、一种数据处理装置、一种计算机设备、一种计算机可读存储介质及一种计算机程序产品。
技术介绍
[0002]日常生活中,广告拉新是广告推荐场景中研究的一个热门话题,所谓广告拉新是指:第一业务方(例如广告主)通过投放广告数据的方式,为第二业务方(例如广告平台)拉来新的用户,以保持访问广告平台的用户数量持续增长的一种方式。
[0003]目前,优化广告拉新效果的常用方式为广告主利用自身所拥有的数据(例如用户的性别、年龄等属性数据)接入至广告平台,广告平台利用广告主所提供的数据预估广告数据的任务指标(如留存率指标,留存率指标可以用于反映广告平台保留用户的能力),从而实现优化广告拉新的效果。但是,由于考虑到数据隐私,广告主通过不会将完整的用户数据接入至广告平台,导致对广告数据的任务指标预估不准确,拉新效果不佳。因此,如何提高预测的任务指标的准确性是当前亟待解决的一个重要问题。
技术实现思路
[0004]本申请实施例提出了一种数据处 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取第一业务方提供的第一特征数据,所述第一特征数据是对第一业务方拥有的第一访问数据进行同态加密处理后得到的,所述第一访问数据包括所述第一业务方提供的广告数据在预设时间段内被访问而产生的数据;获取第二业务方提供的第二特征数据,所述第二特征数据是对第二业务方拥有的第二访问数据进行同态加密处理后得到的,所述第二访问数据包括所述广告数据在所述第二业务方对应的平台曝光的过程中,所述广告数据在所述预设时间段内被访问而产生的数据;在同态空间内对所述第一特征数据和所述第二特征数据进行运算处理,得到样本特征数据;采用所述样本特征数据对多任务模型进行联邦学习训练,训练好的多任务模型用于对所述第一业务方提供的目标广告数据对应的一个或多个任务指标进行预测。2.如权利要求1所述的方法,其特征在于,所述第一访问数据包括在预设时间段内访问所述第一业务方提供的广告数据的m个对象的属性数据;所述第二访问数据包括所述广告数据在所述第二业务方对应的平台曝光的过程中,在所述预设时间段内访问所述广告数据的n个对象的浏览数据;m、n均为正整数;所述方法还包括:对所述第一访问数据和所述第二访问数据进行联邦加密求交处理,得到联邦加密求交处理结果;其中,所述联邦加密求交处理结果用于指示所述第一业务方需从所述第一访问数据中筛选出p个对象的属性数据,并基于所述p个对象的属性数据生成所述第一特征数据;以及,所述联邦加密求交处理结果还用于指示所述第二业务方需从所述第二访问数据中筛选出所述p个对象的浏览数据,并基于所述p个对象的浏览数据生成所述第二特征数据;p为正整数,p≤m且p≤n。3.如权利要求2所述的方法,其特征在于,所述对所述第一访问数据和所述第二访问数据进行联邦加密求交处理,得到联邦加密求交处理结果,包括:对所述m个对象的属性数据进行加密处理,得到加密后的m个属性数据;对所述n个对象的浏览数据进行加密处理,得到加密后的n个浏览数据;根据所述加密后的m个属性数据和所述加密后的n个浏览数据,在加密空间对所述m个属性数据和所述n个浏览数据进行求交集处理,得到联邦加密求交处理结果。4.如权利要求2所述的方法,其特征在于,所述第一业务方生成所述第一特征数据的流程包括:分别对所述p个对象的属性数据进行特征提取处理,得到所述p个对象中各个对象的属性特征;基于所述p个对象的属性特征,确定所述第一特征数据;以及,所述第二业务方生成所述第二特征数据的流程包括:分别对所述p个对象的浏览数据进行特征提取处理,得到所述p个对象中各个对象的浏览特征;基于所述p个对象的浏览特征,确定所述第二特征数据。5.如权利要求1
‑
4任一项所述的方法,其特征在于,所述在同态空间内对所述第一特征数据和所述第二特征数据进行运算处理,得到样本特征数据,包括:
在同态空间内对所述第一特征数据和所述第二特征数据进行同态加密运算,得到同态加密运算后的第三特征数据;在同态空间内对所述第三特征数据进行同态解密处理,得到样本特征数据。6.如权利要求5所述的方法,其特征在于,所述任务指标包括留存率指标;所述样本特征数据还包括p个对象中每个对象的k个留存率标签,p为正整数;所述采用所述样本特征数据对多任务模型进行联邦学习训练,包括:将所述样本特征数据输入至所述多任务模型的全连接层中,输出所述p个...
【专利技术属性】
技术研发人员:李康,江毅,郭俊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。