一种基于Darts的点击率预估模型自动化生成方法技术

技术编号:33549611 阅读:34 留言:0更新日期:2022-05-26 22:45
本发明专利技术公开了一种基于Darts的点击率预估模型自动化生成方法,它涉及大数据/AI技术领域。本发明专利技术的点击率预估模型是推荐系统中的核心技术,其作用是基于用户与物料交互的特征、物料本身的特征、以及用户属性特征来预测用户对某个物料点击的概率。本发明专利技术能基于给定的特征交叉算子空间自动构建出适合当前场景的优秀神经网络架构,同时架构中使用的特征交叉算子也更为丰富;在搜索出超网离散化过程中本专利创新的提出了一种基于弹性阈值结合知识蒸馏离散化的方法,能使得更好的权衡缩小神经网络架构与子网效果指标变差的矛盾。本专利提出的方法能极大的降低推荐系统中点击率预估模型的开发门槛和时间投入,生成出来的点击率预估模型效果指标更加优秀。估模型效果指标更加优秀。估模型效果指标更加优秀。

【技术实现步骤摘要】
一种基于Darts的点击率预估模型自动化生成方法


[0001]本专利技术涉及的是大数据/AI
,具体涉及一种基于Darts的点击率预估模型自动化生成方法。

技术介绍

[0002]近年来随着互联网产业和技术的迅猛发展,人类从信息匮乏的时代进入了一个信息高度过载的时代,人们在互联网上也越来越难从近似海量的商品、新闻、短视频等物料中找到自己真正感兴趣的,为了解决物料信息高度过载的问题,推荐系统技术起到了举足轻重的作用,而在推荐系统技术中点击率预估模型又是重中之重。
[0003]点击率预估模型的作用是基于用户与物料交互的特征、物料本身的特征、以及用户属性特征来预测用户对某个物料点击的概率。传统构建点击率预估模型的方法是算法工程师根据经验设计一个神经网络架构,同时再设计架构中需要使用的特征交叉算子,从而构建出点击率预估模型。传统的方法存在的不足也很明显,首先人工设计的神经网络架构受限于算法工程师本身的经验,或者通常是行业内常见的几种架构(例如:单塔架构、双塔架构等等),人工设计的架构本身并不一定在当前场景下是最优;再者往往架构使用的特征交叉本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Darts的点击率预估模型自动化生成方法,其特征在于,包括以下步骤:(S1):在业务系统中获取用户与物料的交互日志,并结合用户基础属性特征、物料属性特征,生成结构化的特征表A,并为特征表A打上标签,对于物料曝光后的点击记录标注标签为1,对于物料曝光后未点击的记录标注标签为0;将打上标签的特征表A存入服务器内存中;(S2):将特征表A中的每个特征的每个域(field)都映射成m维的特征向量,这样特征表A就映射成了特征向量矩阵H;(S3):定义需要被搜索的搜索空间为集合S,S中的元素为特征交叉算子和skip算子;(S4):定义点击率预估模型的目标神经网络架构是一个由六个节点构成的有向无闭环图结构;(S5):采用Darts中连续松弛化后可微的思想,引入温度参数T,通过两级优化进行超网搜索;(S6):创新的设计了一种通过弹性阈值g结合知识蒸馏的方式把超网离散化生成子网的方法,从而获得最终的点击率预估模型。2.根据权利要求1所述的一种基于Darts的点击率预估模型自动化生成方法,其特征在于,所述的步骤(S2)中的H的形状为n*m,这里n为所有特征的特征域的总数;将特征向量矩阵H存入服务器内存中。3.根据权利要求1所述的一种基于Darts的点击率预估模型自动化生成方法,其特征在于,所述的步骤(S3)中的定义特征交叉算子有FM算子、MLP算子、Self

Attention算子、Hadamard

product算子等,搜索空间中须加上skip算子其表示不做任何操作直连,同时也支持工程师加入自己设计的交叉算子,即:S={skip,FM,MLP,Self

Attention,Hadamard

product...}所有的交叉算子在计算后都通过线性变换映射成k维向量,再通过leaky

ReLU进行非线性激活,把交叉操作、线性变换、非线性激活合并称为交叉算子模块,即搜索空间S中的元素。4.根据权利要求1所述的一种基于Darts的点击率预估模型自动化生成方法,其特征在于,所述的步骤(S4)中的六个节点中0号节点是原始的特征向量,5号节点是汇总输出节点,中间的1

4号节点为经过交叉计算后的特征向量。5.根据权利要求1所述的一种基于Darts的点击率预估模型自动化生成方法,其特征在于,所述的步骤(S5)具体包括...

【专利技术属性】
技术研发人员:傅剑文陈心童韩弘炀章建森周文彬
申请(专利权)人:天翼电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1