基于构造对抗样本的多目标广告生成系统及其方法技术方案

技术编号：27032747 阅读：32 留言：0更新日期：2021-01-12 11:16

本发明专利技术提供一种基于构造对抗样本的多目标广告生成系统及其方法，属于对抗神经网络技术领域。所述方法包括：该方法包括：获取关于用户行为的第一类样本集合和第二类样本集合，并获取具有所述第一类样本集合和所述第二类样本集合的相关特征的对抗样本集合；构造待训练召回模型，利用所述第一类样本集合、所述第二类样本集合和所述对抗样本集合训练所述待训练召回模型，获得具有三分类功能的召回模型，将所述召回模型结合预设过滤规则形成生成模型。本发明专利技术既能保证广告和搜索请求的相关性，又能兼顾用户对广告的点击偏好。

全部详细技术资料下载

【技术实现步骤摘要】
基于构造对抗样本的多目标广告生成系统及其方法
本专利技术涉及对抗神经网络
，具体地涉及一种构造生成模型的方法、一种召回目标结果的方法、一种用于生成模型的系统、一种生成模型、一种用于生产模型的设备和一种计算机可读存储介质。
技术介绍
搜索场景下的广告匹配是一个典型检索问题，可以抽象为生成、粗排序和精排序三个阶段。生成阶段根据用户搜索信息从广告库中检索得到匹配良好(用户搜索意图和广告业务匹配)的候选广告集合；排序阶段根据广告的预估点击率(ctr2)和每千次搜索收入(cpm1)信息等对候选广告进行综合评分并截断，得到最终展现广告集合。传统方案中，生成阶段主要考虑的是广告主投放规则(广告投放时间和地域)，以及广告业务与用户搜索词的语义匹配程度，而排序阶段根据引入的用户个性化信息预估用户对广告的满意程度和预估点击率进行排序和截断，上述传统方案上下游优化目标存在不一致，在历史的计算性能和计算框架背景下是一个折衷的设计。传统方案中，广告生成阶段主要考虑的是广告信息和用户搜索词的语义匹配程度，广告主投放规则(广告投放时间和地域)，传统做法包含两种方式：1)基于词语的匹配：广告主在提广告时，会通过一个短句来描述广告的业务内容，可以称之为广告的买词信息(例如搜索请求是“夏天防紫外线太阳镜”，买词信息则可以是“太阳镜”或“防紫外线眼镜”)；传统做法中，首先对用户搜索请求query进行切词，得到词语集合A；对广告买词进行切词，得到词语集合B；根据词语集合A和B的交集词语个数和长度，作为量化指标来筛选目标展示广告...

【技术保护点】
1.一种构造生成模型的方法，其特征在于，该方法包括：/nS1)获取关于用户行为的第一类样本集合和第二类样本集合，并获取具有所述第一类样本集合和所述第二类样本集合的相关特征的对抗样本集合；/nS2)构造待训练召回模型，利用所述第一类样本集合、所述第二类样本集合和所述对抗样本集合训练所述待训练召回模型，获得具有三分类功能的召回模型，将所述召回模型结合预设过滤规则形成生成模型。/n

【技术特征摘要】
1.一种构造生成模型的方法，其特征在于，该方法包括：
S1)获取关于用户行为的第一类样本集合和第二类样本集合，并获取具有所述第一类样本集合和所述第二类样本集合的相关特征的对抗样本集合；
S2)构造待训练召回模型，利用所述第一类样本集合、所述第二类样本集合和所述对抗样本集合训练所述待训练召回模型，获得具有三分类功能的召回模型，将所述召回模型结合预设过滤规则形成生成模型。

2.根据权利要求1所述的构造生成模型的方法，其特征在于，步骤S1)在获取具有所述第一类样本集合和所述第二类样本集合的相关特征的对抗样本集合之前，包括：
S101)获取样本集合，根据用户行为标注所述样本集合内具有对应关系的请求标识符和目标结果；
S102)相对所述用户行为的触发状态，将所述用户行为是第一触发状态的所述样本集合内样本划分为第一类样本集合，并将所述用户行为是第二触发状态的所述样本集合内样本划分为第二类样本集合，其中，所述第一类样本集合具有第一类请求标识符和第一类目标结果，所述第二类样本集合具有第二类请求标识符和第二类目标结果。

3.根据权利要求2所述的构造生成模型的方法，其特征在于，步骤S1)中获取具有所述第一类样本集合和所述第二类样本集合的相关特征的对抗样本集合，包括：
S103)根据所述第一类请求标识符和所述第二类目标结果构建第一触发事件，并根据所述第二类请求标识符和所述第一类目标结果构建第二触发事件，估计所述第一触发事件的第一概率或者估计所述第二触发事件的第二概率；
S104)利用在步骤S103)中的所述第一概率或所述第二概率，结合预设加权抽样映射关系，获取当前对抗强度；
S105)根据所述当前对抗强度的大小，选择地将与所述第一概率或所述第二概率对应的请求标识符和目标结果，结合预设相关性映射关系，获得当前相关性预测值，在所述当前相关性预测值符合预设相关阈值条件时，再将与所述第一概率或所述第二概率对应的请求标识符和目标结果，标记为对抗样本，返回至步骤S103)，将所有对抗样本形成对抗样本集合。

4.根据权利要求3所述的构造生成模型的方法，其特征在于，步骤S105)中的预设相关性映射关系被配置为：
利用步骤S103)中的请求标识符的词向量和目标结果的词向量进行向量内积计算；或者，
利用步骤S103)中的请求标识符的特征向量和目标结果的特征向量通过预设深度学习模型进行预测。

5.根据权利要求1所述的构造生成模型的方法，其特征在于，步骤S2)中构造待训练召回模型，包括：
S201)形成用于获取当前请求标识符特征向量的第一输入层、第一隐层和第一全连接层；
S202)形成用于获取当前目标结果特征向量的第二输入层、第二隐层和第二全连接层，其中，所述第二输入层和所述第二隐层的层结构相对所述第一输入层和所述第一隐层的层结构为独立，所述第一全连接层和所述第二全连接层具有共用层且所述第一全连接层和所述第二全连接层在所述共用层内进行交叉计算；
S203)形成输出层，其中，所述输出层接收步骤S202)中交叉计算的结果且输出属于在与所述第一类样本集合、所述第二类样本集合和所述对抗样本对应的三分类中一类的当前分类结果；
S204)配置所述第一输入层、所述第一隐层、所述第一全连接层、所述第...

【专利技术属性】
技术研发人员：周星玄，陈少鹏，赵莲，刘林，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人