信息流媒体广告创意推荐方法及装置制造方法及图纸

技术编号:23191749 阅读:27 留言:0更新日期:2020-01-24 16:33
本发明专利技术公开了提供了一种信息流媒体广告创意推荐方法及装置,该方法包括:构建底层存储,底层存储对应的数据库内存储有广告投放数据。从数据库内获取文案数据、素材数据、创意效果数据和用户人群数据。对文案数据、素材数据、创意效果数据和用户人群数据进行数据预处理。对预处理后的文案数据、素材数据、创意效果数据和用户人群数据进行数据挖掘和特征工程,获取用户向量、创意向量和One‑Hot向量。将用户向量、创意向量和One‑Hot向量输入Wide&Deep模型,Wide&Deep模型输出创意推荐给对应用户人群的概率y,y∈【0,1】。根据创意推荐给对应用户人群的概率进行效果评估。本发明专利技术的信息流媒体广告创意推荐方法及装置,可以提高用户在观看创意时的点击率。

Methods and devices of creative recommendation for information streaming media advertisements

【技术实现步骤摘要】
信息流媒体广告创意推荐方法及装置
本专利技术涉及广告推荐
,尤其涉及一种信息流媒体广告创意推荐方法及装置。
技术介绍
创意是由素材(图片)和文案(文字)构成,目前在信息流媒体创意推荐领域中,采取的主流结构是输入素材、文案内容以及创意效果数据,选用机器学习模型去构建CTR预估模型,CTR(Click-Through-Rate)即点击通过率,在此具体指的是该创意的实际点击次数除以创意的展现量。业界传统的CTR预估解法是广义线性模型LR(logisticregression,逻辑斯特回归)+人工特征工程。LR使用了Logit变换将函数值映射到[0,1]区间,映射后的函数值就是CTR的预估值。LR这种线性模型很容易并行化,处理上亿条训练样本不是问题。但这种解法的不足是,因为线性模型的学习能力有限,需要引入大量的领域知识来人工设计特征以及特征之间的交叉组合来间接补充算法的非线性学习能力,非常消耗人力和机器资源,迁移性不够友好。此外还有常见的Treebased方法,这种方法虽然能够有效解决LR模型的特征组合问题,但缺点就是仍然是对历史行为的记本文档来自技高网...

【技术保护点】
1.一种信息流媒体广告创意推荐方法,其特征在于,所述方法包括:/n构建底层存储,所述底层存储对应的数据库内存储有广告投放数据;/n从所述数据库内获取文案数据、素材数据、创意效果数据和用户人群数据;/n对所述文案数据、素材数据、创意效果数据和用户人群数据进行数据预处理;/n对预处理后的所述文案数据、素材数据、创意效果数据和用户人群数据进行数据挖掘和特征工程,获取用户向量、创意向量和One-Hot向量;/n将所述用户向量、创意向量和One-Hot向量输入Wide&Deep模型,采取梯度下降算法更新模型权重数值,得到降低模型损失的效果,所述Wide&Deep模型输出创意推荐给对应用户...

【技术特征摘要】
1.一种信息流媒体广告创意推荐方法,其特征在于,所述方法包括:
构建底层存储,所述底层存储对应的数据库内存储有广告投放数据;
从所述数据库内获取文案数据、素材数据、创意效果数据和用户人群数据;
对所述文案数据、素材数据、创意效果数据和用户人群数据进行数据预处理;
对预处理后的所述文案数据、素材数据、创意效果数据和用户人群数据进行数据挖掘和特征工程,获取用户向量、创意向量和One-Hot向量;
将所述用户向量、创意向量和One-Hot向量输入Wide&Deep模型,采取梯度下降算法更新模型权重数值,得到降低模型损失的效果,所述Wide&Deep模型输出创意推荐给对应用户人群的概率y,y∈【0,1】;
根据所述创意推荐给对应用户人群的概率进行效果评估。


2.根据权利要求1所述的信息流媒体广告创意推荐方法,其特征在于,数据预处理包括:数据归一化、缺失值处理、编码格式统一和无效特征处理。


3.根据权利要求2所述的信息流媒体广告创意推荐方法,其特征在于,通过下述转化函数进行数据归一化:
x2=(x1-u)/σ
式中,x2为归一化后的数据,x1为原始数据,u为所有样本数据的均值,σ为所有样本数据的标准差。


4.根据权利要求2所述的信息流媒体广告创意推荐方法,其特征在于,所述缺失值处理包括:
数据中存在缺失值时,当缺失值数量在预设阈值以下时,若缺失值是数值型变量,缺失值取当前特征的平均值,若缺失值是类别型变量,缺失值取1,若缺失值数量超过预设阈值时,删除该特征。


5.根据权利要求2所述的信息流媒体广告创意推荐方法,其特征在于,所述无效特征处理包括:若该特征中的重复数值超过预设阈值时,删除该特征。


6.根据权利要求1或2所述的信息流媒体广告创意推荐方法,其特征在于,所述对预处理后的所述文案数据、素材数据、创意效果数据和用户人群数据进行数据挖掘和特征工程,获取用户向量、创意向量和One-Hot向量,包括:
从所述用户人群数据中获取用户基础属性、行为兴趣偏好和场景特征,进行特征向量化,作为用户向量;
从所述素材数据中获取风格标注,从所述文案数据中获取词性标注,通过One-Hot编码获取One-Hot向量,作为部分创意向量;
从所述...

【专利技术属性】
技术研发人员:罗毅罗文辉招伟锦杨忠轩吕子锋
申请(专利权)人:广州市丰申网络科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1