【技术实现步骤摘要】
一种用户兴趣向量提取方法、提取模型及计算机系统
[0001]本专利技术涉及人工智能领域,具体涉及到一种基于用户双向反馈的用户兴趣提取方法、提取模型及计算机系统。
技术介绍
[0002]在推荐排序算法发展的过程中,一些算法创造性的加入了用户行为序列,将用户行为序列作为排序模型的一个上下文特征,来预测用户对当前商品的点击概率,解决了用户兴趣多样性、用户兴趣随时间迁移的问题,在实际应用中也取得了明显的收益。
[0003]但是在已有的实际应用中,大多是从用户的已有行为中,获取用户的兴趣。比如DIN模型中,通过用户行为建模获取用户兴趣向量。但是,如果只使用正向行为进行建模,会将用户的兴趣过度集中在已有行为上,将用户兴趣
‘
窄化
’
而无法获得更好的泛化能力,在排序时也无法给用户足够的惊喜度。根据我们的理解,用户点击或购买某个商品,一定是对该商品具有的某个或某些特性感兴趣,但不应该使用当前商品的所有特征来完全代表用户的兴趣。如果能将用户的特征或者特性通过一些方式提取出来,可以更精准描述用户兴趣, ...
【技术保护点】
【技术特征摘要】
1.一种用户兴趣向量提取方法,其特征在于,该方法包括有如下步骤:第一步,数据拿到,将用户的行为数据和商品的信息数据输入,用户已经发生的行为包括正反馈行为和负反馈行为两种类型,正反馈行为包括用户对商品的浏览、加购物车、收藏或购买操作,负反馈行为是用户曝光了商品,但未对商品产生浏览、加购物车、收藏或购买操作,将用户过往已经接触到的商品结合对应的行为类型分为正反馈商品和负反馈商品,所述正反馈商品和负反馈商品均作为行为商品,将行为商品作为用户兴趣向量提取的基础数据,以用户曝光点击行为作为时间界限,将后续用户曝光且点击的商品作为正样本,用户曝光但未点击的商品作为负样本,正样本商品和负样本商品均作为候选商品,设置正样本商品对应标签1,负样本商品对应标签0,商品的信息数据包括商品的ID、类别、品牌和所属店铺;第二步,特征获得,对于包括正反馈商品和负反馈商品的行为商品,分别依据商品的ID、类别、品牌和所属店铺进行multi_hot编码获得行为商品稀疏的特征向量,分别得到正反馈商品稀疏的特征向量和负反馈商品稀疏的特征向量,所述候选商品经过multi_hot编码得到候选商品稀疏的特征向量;第三步,模型构建,该模型结构上包括有商品特征嵌入层、拼接层、激活网络、池化层和差值模块,所述商品特征嵌入层分别将行为商品稀疏的特征向量和候选商品稀疏的特征向量映射为稠密的特征向量,所述拼接层分别将正反馈商品和负反馈商品的ID、类别、品牌和所属店铺四个领域的特征拼接得到正反馈商品拼接向量和负反馈商品拼接向量,将候选商品ID、类别、品牌和所属店铺四个领域的特征拼接得到候选商品拼接向量,所述激活网络将正反馈商品拼接向量、负反馈商品拼接向量分别与候选商品拼接向量相关程度进行衡量处理,得到行为商品的关联度,该关联度即权重,将行为商品的拼接向量乘以行为商品拼接向量的权重,分别获得正反馈商品的加权向量和负反馈商品的加权向量,所述池化层将行为商品的加权向量求和池化,分别得到商品的正向特征向量和商品的负向特征向量,差值模块将商品的正向特征向量与商品的负向特征向量求差值,该差值为用户兴趣向量;第四步,模型训练,将第一步得到的样本数据经过第二步处理后,输入至第三步的模型中进行模型训练,依据模型输出的用户兴趣向量进行数据调整,即通过反向传播进行模型参数的迭代,直至模型精度不再增加时停止迭代,得到收敛的模型,完成提取模型的训练;第五步,模型应用,将新的用户行为数据输入到训练好的提取模型中,提取所需要的用户兴趣向量。2....
【专利技术属性】
技术研发人员:刘文海,于敬,石京京,王灿,纪达麒,陈运文,
申请(专利权)人:达而观数据成都有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。