【技术实现步骤摘要】
一种利用相邻信息增强对话式推荐系统的方法
[0001]本专利技术属于计算机人工智能
,具体涉及一种利用相邻信息增强对话式推荐系统的方法。
技术介绍
[0002]对话式推荐系统是人工智能技术中信息检索的重要研究任务。推荐系统旨在根据用户与物品的历史交互信息,来预测用户对物品的偏好。推荐系统可以从海量的信息中为用户选择可能感兴趣的信息并推荐给用户,使得电商、短视频等平台迅速崛起。但是推荐系统无法获取用户实时的信息需求和偏好,系统提供的推荐有一定的局限性。
[0003]对话式推荐系统旨在通过自然语言与用户交互,在聊天的过程中获取用户实时的偏好和反馈,为用户提供合适的推荐结果。此外,与传统推荐系统相比,对话式推荐系统也能将推荐结果融入到系统回复中形成推荐理由,让用户更容易接受推荐。
[0004]对话式推荐系统有两个挑战:(1)建模对话中的稀疏偏好(2)缺乏足够的训练数据。
[0005]稀疏用户偏好。自然语言的交互使得对话式推荐系统能够获取更广的用户偏好,然而也为理解用户偏好带来了不小的挑战。在传统推荐系 ...
【技术保护点】
【技术特征摘要】
1.一种利用相邻信息增强对话式推荐系统的方法,其特征在于,所述方法具体包括以下步骤:步骤一、利用对话被推荐的目标物品的相邻物品构建伪标签数据,再基于伪标签数据构造对话式推荐系统的训练集,训练后得到训练好的对话式推荐系统;所述步骤一的具体过程为:步骤1、获取对话数据集;步骤2、对于数据集中的任一对话,利用该对话构造一个训练样本其中,表示经过对话式推荐系统得到的该对话上下文的表示向量,表示该对话被推荐的目标物品的表示向量,代表对于该对话所生成的回复的表示向量;利用目标物品的表示向量从待推荐候选物品集Y中检索出n个与目标物品相邻的物品,利用检索出的相邻物品的表示向量分别替换训练样本中的将替换后的训练样本作为伪标签训练样本;同理,对数据集中的每个对话分别进行处理,将基于数据集中的各个对话构造的训练样本组成的集合记作D,将获得的全部伪标签训练样本组成的集合记作其中,代表根据一个目标物品的表示向量检索出的相邻物品集合,代表集合中包含的相邻物品的个数,即|D|代表数据集中包含的对话个数,i
’
代表D
p
中的第i
’
个伪标签训练样本,表示第i
’
个伪标签训练样本对应的对话上下文的表示向量,表示第i
’
个伪标签训练样本中推荐目标物品的表示向量,代表对第i
’
个伪标签训练样本对应的对话生成回复的表示向量;步骤3、将D与D
p
的并集D∪D
p
作为本次迭代的训练集,利用训练集来训练对话式推荐系统步骤4、重复执行步骤2至步骤3的过程,直至达到设置的最大迭代次数时停止迭代,获得训练好的对话式推荐系统步骤二、将当前对话输入到训练好的对话式推荐系统,得到对当前对话的物品推荐结果和回复生成结果。2.根据权利要求1所述的一种利用相邻信息增强对话式推荐系统的方法,其特征在于,所述利用目标物品的表示向量从待推荐候选物品集Y中检索出n个与目标物品相邻的物品,其具体过程为:分别计算待推荐候选物品集Y中的每个物品的表示向量与的余弦相似度,将与的余弦相似度最大的n个物品作为检索出的n个相邻物品:其中,函数代表从待推荐候选物品集Y中检索出的n个相邻物品。3.根据权利要求2所述的一种利用相邻信息增强对话式推荐系统的方法,其特征在于,所述步骤3的具体过程为:步骤1)、对于并集D∪D
p
中的任一训练样本,从候选对话表示向量集合X中检索出与该训
练样本上下文表示向量相邻的对话表示向量,基于检索出的相邻对话表示向量计算每个候选物品的参数b
′
以及该训练样本对应的向量根据向量和参数b
′
得到对于上下文表示向量的物品推荐结果和回复生成结果;同理,对并集D∪D
p
中的每个训练样本进行处理;步骤2)、根据步骤1)中得到的物品推荐结果和回复生成结果计算物品推荐任务的损失,再根据损失更新对话式推荐系统的参数;步骤3)、设置伪标签训练样本集为空集,即设置再返回步骤2。4.根据权利要求3所述的一种利用相邻信息增强对话式推荐系统的方法,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。