一种基于联邦学习的广告曝光方法技术

技术编号：41328750 阅读：4 留言：0更新日期：2024-05-13 15:06

本发明专利技术属于数据移动通信技术领域，公开了一种基于联邦学习的广告曝光方法，包括：S1、存量数据联合建模；根据广告主的存量用户标签与第三方数据的用户的特征进行联合建模，并对模型进行评估；S2、在线推理；根据用户传输的竞价请求数据、需求方已有的用户数据及第三方数据，调用联合模型利用同态加密的方式进行在线推理，并将在线推理结果反馈给广告主的竞价决策模块。本发明专利技术本联合多源数据进行联邦学习，扩充定价的数据源样本，结合多方的数据能力共同提升定价准确性和广告主投放效果；能有效保证数据交互动作的安全及原始数据的安全，提升广告曝光率，提升广告转化率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据移动通信，具体涉及一种基于联邦学习的广告曝光方法。

技术介绍

1、rta是一种实时广告程序接口,在常规媒体直投方式下，广告主向媒体表达优化目标和成本考核，媒体依托数据和算法进行优化和流量选择，广告主无法参与流量及用户的筛选；通过rta接口，媒体可以向广告主同步流量信息，广告主可以根据自身要求，对流量进行一定程度的筛选。

2、媒体向adx(广告交易平台)发起广告请求的时候，会携带一些用户的行为数据，例如用户id、网站信息、媒体频道、终端尺寸等，将其发送给dsp(需求方平台)平台发起竞价请求，使得广告主的数据得不到保护；并且现有的广告曝光方式的竞价方式较为单一，通过需求方的用户数据中心存量数据进行出价响应，导致广告曝光率和广告转化率比较低，需要进行改进。

技术实现思路

1、本专利技术的目的在于提供一种基于联邦学习的广告曝光方法，用于解决
技术介绍
中提出的技术问题。

2、为了实现上述目的，本专利技术采用了如下技术方案：一种基于联邦学习的广告曝光方法，包括：

3、s1、存量数据联合建模；

4、根据广告主的存量用户标签与第三方数据的用户的特征进行联合建模，并对模型进行评估；

5、s2、在线推理；

6、根据用户传输的竞价请求数据、需求方已有的用户数据及第三方数据，调用联合模型利用同态加密的方式进行在线推理，并将在线推理结果反馈给广告主的竞价决策模块；

7、s3、转化数据回流；

8、广

9、优选的，所述联合建模的模型为逻辑回归模型，具体包括如下步骤：

10、s11、将广告主的存量用户标签与第三方数据的用户的特征进行样本对齐，并建立特征变量数据集，将数据集划分为训练集和测试集；

11、s12、采用交叉验证方法，使用训练集来训练逻辑回归模型；

12、s13、选择逻辑回归模型作为分类算法，逻辑回归模型将特征的线性组合通过逻辑函数映射到[0,1]之间的概率值，表示事件发生的概率；

13、s14、采用最大似然估计方法，使用训练集数据来估计逻辑回归模型的参数，以获得最佳的参数值；

14、s15、使用测试集数据来评估模型的性能。

15、优选的，所述模型评估包括根据ks值和auc值进行评估，其中ks值的计算方法具体如下：对测试集中的样本按照模型预测概率值进行排序；并计算每个可能的概率阈值下的真正例率和假正例率；具体计算公式如下：

16、ks＝max(tpr-fpr)；

17、式中，ks为ks值，tpr表示真正利率，fpr表示假正利率。

18、优选的，auc值的计算方法如下：使用训练好的模型对测试集或验证集的样本进行预测，得到样本的预测概率值；并根据不同的分类阈值，计算真正例率和假正例率；通过以假正例率为横轴，真正例率为纵轴，绘制roc曲线；进而计算出roc曲线下的面积，计算的结果即为auc值。

19、优选的，所述交叉验证法包括如下步骤：

20、将训练数据集分成k个互斥的子集；

21、将模型训练k次，每次使用k-1个子集的数据作为训练集，剩下的1个子集作为验证集；

22、对k次训练得到的模型性能进行评估；

23、计算k次评估结果的平均性能，作为模型的性能指标。

24、优选的，所述最大似然估计方法的步骤如下：

25、定义似然函数

26、式中，n是样本数量，yi是第i个样本的观测值(0或1)，xi是第i个样本的特征向量，p(yi＝1xi)是给定特征xi条件下目标变量yi取值为1的概率。

27、优选的，用户传输的竞价请求数据获取方式如下：用户访问网站/app,通知广告交易平台发起广告曝光请求并传输用户及用户本次请求的相关特征数据；竞价监听服务监听到本次竞价请求。

28、优选的，所述在线推理的具体方式通过如下步骤体现：

29、s21、将用户传输的本次请求数据、需求方已有的用户数据和第三方数据进行预处理和特征工程，以确保它们具有相同的特征和数据格式；

30、s22、在明文数据上训练逻辑回归模型，获得模型参数；

31、s23、使用同态加密库对逻辑回归模型的参数进行加密；

32、s24、将用户传输的请求数据、需求方已有的用户数据和第三方数据进行同态加密；

33、s25、将加密的数据传递给云服务器或可信执行环境，其中存储了同态加密的逻辑回归模型参数；在云服务器或可信执行环境中，执行逻辑回归模型的预测，使用同态加密技术进行计算；

34、s26、将模型的预测结果进行解密，以获取明文的预测结果；将预测结果返回给用户。

35、优选的，s21中预处理包括对数据去重，降噪处理；特征工程包括对数据进行特征提取；

36、所述数据去重是将用户传输的本次请求数据、需求方已有的用户数据和第三方数据按照特定的规则排序，然后依次比较相邻记录，将相邻重复的记录进行删除，只保留一个；

37、所述特征提取是利用机器学习算法将原始特征数据转换为机器学习算法可处理的特征形式。

38、优选的，模型的迭代优化包括如下步骤：

39、s31、广告主将更新后的用户数据与第三方的数据进行样本对齐，并建立特征变量数据集，将数据集划分为训练集和测试集；

40、s32、根据训练集来训练逻辑回归模型；

41、s33、使用测试集数据来评估模型的性能。

42、综上所述，由于采用了上述技术方案，本专利技术的有益效果是：

43、1、本专利技术本联合多源数据进行联邦学习，扩充定价的数据源样本，结合多方的数据能力共同提升定价准确性和广告主投放效果；能有效保证数据交互动作的安全及原始数据的安全，提升广告曝光率，提升广告转化率。

44、2、本专利技术通过全同态的在线推理方法，保证原始数据及中间计算结果的安全性，满足出价响应；用户特征数据回传，用户标签数据回流，响应目标人群实时变动，可实现模型定向更新，与现有技术相比数据使用的安全性更高、定价方案更灵活、广告的转化率更高。

本文档来自技高网...

【技术保护点】

1.一种基于联邦学习的广告曝光方法，其特征在于，包括：

2.如权利要求1所述的基于联邦学习的广告曝光方法，其特征在于，所述联合建模的模型为逻辑回归模型，具体包括如下步骤：

3.如权利要求1所述的基于联邦学习的广告曝光方法，其特征在于，所述模型评估包括根据KS值和AUC值进行评估，其中KS值的计算方法具体如下：

4.如权利要求3所述的基于联邦学习的广告曝光方法，其特征在于，AUC值的计算方法如下：

5.如权利要求2所述的基于联邦学习的广告曝光方法，其特征在于，所述交叉验证法包括如下步骤：

6.如权利要求5所述的基于联邦学习的广告曝光方法，其特征在于，所述最大似然估计方法的步骤如下：

7.如权利要求6所述的基于联邦学习的广告曝光方法，其特征在于，用户传输的竞价请求数据获取方式如下：

8.如权利要求7所述的基于联邦学习的广告曝光方法，其特征在于，所述在线推理的具体方式通过如下步骤体现：

9.如权利要求8所述的基于联邦学习的广告曝光方法，其特征在于，S21中预处理包括对数据去重，降噪处理；特征

10.如权利要求9所述的基于联邦学习的广告曝光方法，其特征在于，模型的迭代优化包括如下步骤：

...

【技术特征摘要】

1.一种基于联邦学习的广告曝光方法，其特征在于，包括：

2.如权利要求1所述的基于联邦学习的广告曝光方法，其特征在于，所述联合建模的模型为逻辑回归模型，具体包括如下步骤：

3.如权利要求1所述的基于联邦学习的广告曝光方法，其特征在于，所述模型评估包括根据ks值和auc值进行评估，其中ks值的计算方法具体如下：

4.如权利要求3所述的基于联邦学习的广告曝光方法，其特征在于，auc值的计算方法如下：

5.如权利要求2所述的基于联邦学习的广告曝光方法，其特征在于，所述交叉验证法包括如下步骤：

6.如权利要...

【专利技术属性】
技术研发人员：刘天琪，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人