【技术实现步骤摘要】
基于预训练语义模型的超球面协同度量推荐装置和方法
本专利技术涉及计算机应用,特别是涉及一种基于预训练语义模型的超球面(或称超维球面)协同度量推荐装置和方法。
技术介绍
推荐算法属于人工智能和计算机技术的交叉学科,推荐算法的任务旨在通过分析用户的历史行为数据,计算机算法建模预测用户喜欢的物品,给出推荐。推荐系统算法的进步提高了人们在面对“信息过载”的情形下,处理海量的网络信息的效率和体验,对内容生成者来说,高效的推荐系统可以帮助内容在平台的传播更快速、准确的触达目标用户,提升内容传播效率和质量。常用的购物、电影、社交等领域的网站如谷歌、淘宝、百度、豆瓣都离不开推荐系统的支持。在互联网时代快速发展的背景下,我们作为个人用户,每天都处于信息爆炸的环境下。用户都需要面对海量的信息来进行选择,在此背景下,推荐系统对用户和平台的重要性越来越高。一个性能优秀的推荐系统可以帮助用户在有限的时间内浏览到更符合他偏好的商品或信息。通常来说,推荐系统依据用户的基本信息以及他过往的浏览和交互记录(评分、点赞等)刻画用户画像和对物品的特征建模。一个物 ...
【技术保护点】
1.一种基于预训练语义模型的超球面协同度量推荐装置,其特征在于,包括预训练隐语义模块和协同度量推荐模块,所述预训练隐语义模块包括物品文本信息编码器和解码器,所述协同度量推荐模块包括超球面映射模块和融合损失函数模块;/n其中,物品的文本信息首先经过所述预训练隐语义模块的编码器和解码器,获得物品的文本信息向量化表征,以用于所述协同度量推荐模块的训练和预测,以及物品的冷启动;所述超球面映射模块用于以角度度量的方式,将初始化的正、负用户和物品隐向量分别映射到同一高维超球面流形中,所述融合损失函数模块用于对超球面映射后的用户和物品隐向量进行训练,同时优化正、负用户物品样品对的类内类间 ...
【技术特征摘要】
1.一种基于预训练语义模型的超球面协同度量推荐装置,其特征在于,包括预训练隐语义模块和协同度量推荐模块,所述预训练隐语义模块包括物品文本信息编码器和解码器,所述协同度量推荐模块包括超球面映射模块和融合损失函数模块;
其中,物品的文本信息首先经过所述预训练隐语义模块的编码器和解码器,获得物品的文本信息向量化表征,以用于所述协同度量推荐模块的训练和预测,以及物品的冷启动;所述超球面映射模块用于以角度度量的方式,将初始化的正、负用户和物品隐向量分别映射到同一高维超球面流形中,所述融合损失函数模块用于对超球面映射后的用户和物品隐向量进行训练,同时优化正、负用户物品样品对的类内类间距离;
其中,将物品文本信息输入所述预训练隐语义模块,得到物品文本信息特征向量,加入到所述协同度量推荐模型中的物品隐向量中以进行所述训练;在预测阶段,获得物品的文本向量和对应的用户物品隐向量,通过计算两者的余弦距离的方式,获得用户的物品推荐结果。
2.如权利要求1所述的超球面协同度量推荐装置,其特征在于,还包括正负随机采样模块,用于对训练样本做随机采样后提供给所述协同度量推荐模块。
3.如权利要求1或2或所述的超球面协同度量推荐装置,其特征在于,所述预训练隐语义模块为BERT预训练模型,由其获取物品文本的语义化向量表达。
4.如权利要求1至3任一项所述的超球面协同度量推荐装置,其特征在于,所述物品编码器包括位置嵌入模块和多层的编码层,所述位置嵌入模块对输入做词嵌入,并记录文本中各个词汇的位置信息,所述多层的编码层包含有多头注意力模块、前馈神经网络模块和规范化模块,其中,所述多头注意力模块用于对输入文本向量之间词与词的关系进行捕捉,获得句子内部词汇的关系,所述前馈神经网络用于提高模块的泛化性并增加神经网络的深度,所述规范化模块用于进行正则化以保证输出的一致性。
5.如权利要求4所述的超球面协同度量推荐装置,其特征在于,所述物品解码器具有自注意力模块,所述自注意力模块用于计算...
【专利技术属性】
技术研发人员:郑海涛,汪杨,刘昊,肖喜,沈颖,周岚,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。