实体推荐方法和装置制造方法及图纸

技术编号:18576104 阅读:36 留言:0更新日期:2018-08-01 11:08
本申请实施例公开了实体推荐方法和装置。实体推荐方法包括响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;将候选实体集合输入预先训练的排序模型,得到候选实体序列;以及从候选实体序列中选取候选实体,并向用户推荐所选取的候选实体;其中,排序模型基于以下至少一者对候选实体集合进行排序:候选实体集合中,各候选实体与待搜索实体的相关度;用户对候选实体集合中的各候选实体的兴趣度;以及用户对候选实体集合中的各候选实体的预期度。该实施方式实现了针对用户和/或待搜索实体的更加相关、个性化、惊喜化、多样性的实体推荐。

Entity recommendation methods and devices

The application embodiment discloses entity recommendation method and device. The entity recommendation method includes the search requests received from the user to the entity, the collection of candidate entities associated with the search entity, the set of candidate entities into the pre trained sort model, the sequence of candidate entities, and the selection of candidate entities from the sequence of candidate entities, and recommends the selected candidate to the user. Selection entities; among them, the sorting model is based on at least one of the following groups to sort the collection of candidate entities: the degree of correlation between the candidate entities and the entity to be searched in the candidate entity set; the user's interest in the candidate entities in the candidate entity set; and the expectation of the user on the candidate entities in the candidate entity set. The embodiment implements more relevant, personalized, surprising, and diverse entity recommendations for users and/or entities to be searched.

【技术实现步骤摘要】
实体推荐方法和装置
本申请实施例涉及互联网领域,具体涉及搜索领域,尤其涉及实体推荐方法和装置。
技术介绍
实体推荐,是指向用户提供实体建议,从而帮助用户发现其感兴趣的信息的一系列操作。现有技术中,通常采用协同过滤的方式来进行实体推荐。协同过滤算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
技术实现思路
本申请实施例提出了实体推荐方法和装置。第一方面,本申请实施例提供了一种实体推荐方法,包括:响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;将候选实体集合输入预先训练的排序模型,得到候选实体序列;以及从候选实体序列中选取候选实体,并向用户推荐所选取的候选实体;其中,排序模型基于以下至少一者对候选实体集合进行排序:候选实体集合中,各候选实体与待搜索实体的相关度;用户对候选实体集合中的各候选实体的兴趣度;以及用户对候选实体集合中的各候选实体的预期度。在一些实施例中,获取与待搜索实体关联的候选实体集合进一步包括:响应于候选实体与待搜索实体在预设知识图谱中存在关联关系,将候选实体添加至候选实体集合中。在一些实施例中,获取与待搜索实体关联的候选实体集合进一步包括:响应于候选实体与待搜索实体在搜索会话历史中的共现次数超过预设的第一阈值,将候选实体添加至候选实体集合中。在一些实施例中,获取与待搜索实体关联的候选实体集合进一步包括:将预设的语料库中,与待搜索实体具有共现关系的实体作为共现候选实体;将与待搜索实体的相关度超过预设的第二阈值的共现候选实体添加至候选实体集合中。在一些实施例中,排序模型通过如下的步骤训练得到:生成训练样本集,训练样本集中的每个训练样本包括三元组和点击行为标注,三元组包括用户身份标识、第一实体和第二实体,点击行为标注用于指示用户在搜索第一实体得到的搜索结果中,是否对第二实体具有点击行为;对于所生成的训练样本集中的每一个训练样本,生成该训练样本的特征向量;将训练样本集和所生成的特征向量输入预先建立的梯度提升决策树模型,基于随机梯度下降算法对梯度提升决策树模型进行训练;响应于交叉熵损失函数最小,生成排序模型;其中,特征向量包括用于指示以下至少一者的特征值:各三元组中的第一实体和第二实体之间的相关度;各三元组中的用户对该三元组中第二实体的兴趣度;以及各三元组中的用户对该三元组中第二实体的预期度。在一些实施例中,用于指示各三元组中的第一实体和第二实体之间的相关度的分量包括以下至少一者:三元组中的第一实体和第二实体在预设知识图谱中的相关度;三元组中的第一实体和第二实体在搜索会话历史中的共现度;三元组中的第一实体和第二实体在预设语料库中的共现度;以及三元组中的第一实体和第二实体的主题相似度。在一些实施例中,用于指示各三元组中的用户对该三元组中第二实体的兴趣度的特征值包括以下至少一者:该三元组中,第二实体的点击率;第二实体在预设分类表中所属的主题类别的点击率;三元组中的第一实体和第二实体的语义相似度。在一些实施例中,用于指示各三元组中的用户对该三元组中第二实体的预期度的特征值包括以下至少一者:基于三元组中用户的历史点击数据确定的用户和/或第一实体对第二实体的关系熟悉度;三元组中的第二实体相对用户和/或第一实体的意外度;以及三元组中,第一实体的点击多样性。第二方面,本申请实施例还提供一种实体推荐装置,包括:获取单元,配置用于响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;排序单元,配置用于将候选实体集合输入预先训练的排序模型,得到候选实体序列;以及推荐单元,配置用于从候选实体序列中选取候选实体,并向用户推荐所选取的候选实体;其中,排序模型基于以下至少一者对候选实体集合进行排序:候选实体集合中,各候选实体与待搜索实体的相关度;用户对候选实体集合中的各候选实体的兴趣度;以及用户对候选实体集合中的各候选实体的预期度。在一些实施例中,获取单元在获取与待搜索实体关联的候选实体集合时,进一步配置用于:响应于候选实体与待搜索实体在预设知识图谱中存在关联关系,将候选实体添加至候选实体集合中。在一些实施例中,获取单元在获取与待搜索实体关联的候选实体集合时,进一步配置用于:响应于候选实体与待搜索实体在搜索会话历史中的共现次数超过预设的第一阈值,将候选实体添加至候选实体集合中。在一些实施例中,获取单元在获取与待搜索实体关联的候选实体集合时,进一步配置用于:将预设的语料库中,与待搜索实体具有共现关系的实体作为共现候选实体;将与待搜索实体的相关度超过预设的第二阈值的共现候选实体添加至候选实体集合中。在一些实施例中,装置还包括训练单元,训练单元配置用于训练排序模型;训练单元包括:训练样本生成模块,配置用于生成训练样本集,训练样本集中的每个训练样本包括三元组和点击行为标注,三元组包括用户身份标识、第一实体和第二实体,点击行为标注用于指示用户在搜索第一实体得到的搜索结果中,是否对第二实体具有点击行为;特征向量生成模块,配置用于对于所生成的训练样本集中的每一个训练样本,生成该训练样本的特征向量;迭代训练模块,配置用于将训练样本集和所生成的特征向量输入预先建立的梯度提升决策树模型,基于随机梯度下降算法对梯度提升决策树模型进行训练;以及生成单元,配置用于响应于交叉熵损失函数最小,生成排序模型;其中,特征向量包括用于指示以下至少一者的特征值:各三元组中的第一实体和第二实体之间的相关度;各三元组中的用户对该三元组中第二实体的兴趣度;以及各三元组中的用户对该三元组中第二实体的预期度。在一些实施例中,用于指示各三元组中的第一实体和第二实体之间的相关度的分量包括以下至少一者:三元组中的第一实体和第二实体在预设知识图谱中的相关度;三元组中的第一实体和第二实体在搜索会话历史中的共现度;三元组中的第一实体和第二实体在预设语料库中的共现度;以及三元组中的第一实体和第二实体的主题相似度。在一些实施例中,用于指示各三元组中的用户对该三元组中第二实体的兴趣度的特征值包括以下至少一者:该三元组中,第二实体的点击率;第二实体在预设分类表中所属的主题类别的点击率;三元组中的第一实体和第二实体的语义相似度。在一些实施例中,用于指示各三元组中的用户对该三元组中第二实体的预期度的特征值包括以下至少一者:基于三元组中用户的历史点击数据确定的用户和/或第一实体对第二实体的关系熟悉度;三元组中的第二实体相对用户和/或第一实体的意外度;以及三元组中,第一实体的点击多样性。第三方面,本申请实施例还提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面任一的方法。第四方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面任一的方法。本申请实施例提供的实体推荐方法和装置,通过响应于接收到用户对实体的搜索请求,在预设的实体集合中获取与待搜索实体关联的候选实体集合;接着,将候选实体集合输入预先训练的排序模型,得到候选实体序列;最后,从候选实体序列中选取本文档来自技高网...

【技术保护点】
1.一种实体推荐方法,包括:响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;将所述候选实体集合输入预先训练的排序模型,得到候选实体序列;以及从所述候选实体序列中选取候选实体并将所选取的候选实体向用户推荐;其中,所述排序模型基于以下至少一者对所述候选实体集合进行排序:所述候选实体集合中,各候选实体与所述待搜索实体的相关度;所述用户对所述候选实体集合中的各候选实体的兴趣度;以及所述用户对候选实体集合中的各候选实体的预期度。

【技术特征摘要】
1.一种实体推荐方法,包括:响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;将所述候选实体集合输入预先训练的排序模型,得到候选实体序列;以及从所述候选实体序列中选取候选实体并将所选取的候选实体向用户推荐;其中,所述排序模型基于以下至少一者对所述候选实体集合进行排序:所述候选实体集合中,各候选实体与所述待搜索实体的相关度;所述用户对所述候选实体集合中的各候选实体的兴趣度;以及所述用户对候选实体集合中的各候选实体的预期度。2.根据权利要求1所述的方法,其中,获取与待搜索实体关联的候选实体集合进一步包括:响应于候选实体与待搜索实体在预设知识图谱中存在关联关系,将所述候选实体添加至所述候选实体集合中。3.根据权利要求1或2所述的方法,其中,获取与待搜索实体关联的候选实体集合进一步包括:响应于候选实体与待搜索实体在搜索会话历史中的共现次数超过预设的第一阈值,将所述候选实体添加至所述候选实体集合中。4.根据权利要求3所述的方法,其中,获取与待搜索实体关联的候选实体集合进一步包括:将预设的语料库中,与待搜索实体具有共现关系的实体作为共现候选实体;将与待搜索实体的相关度超过预设的第二阈值的共现候选实体添加至所述候选实体集合中。5.根据权利要求1所述的方法,其中,所述排序模型通过如下的步骤训练得到:生成训练样本集,所述训练样本集中的每个训练样本包括三元组和点击行为标注,所述三元组包括用户身份标识、第一实体和第二实体,所述点击行为标注用于指示用户在搜索所述第一实体得到的搜索结果中,是否对所述第二实体具有点击行为;对于所生成的训练样本集中的每一个训练样本,生成该训练样本的特征向量;将所述训练样本集和所生成的特征向量输入到预先建立的梯度提升决策树模型中,基于随机梯度下降算法对所述梯度提升决策树模型进行训练;响应于交叉熵损失函数最小,生成所述排序模型;其中,所述特征向量包括用于指示以下至少一者的特征值:各三元组中的第一实体和第二实体之间的相关度;各三元组中的用户对该三元组中第二实体的兴趣度;以及各三元组中的用户对该三元组中第二实体的预期度。6.根据权利要求5所述的方法,其中,所述用于指示各三元组中的第一实体和第二实体之间的相关度的分量包括以下至少一者:所述三元组中的第一实体和第二实体在预设知识图谱中的相关度;所述三元组中的第一实体和第二实体在搜索会话历史中的共现度;所述三元组中的第一实体和第二实体在预设语料库中的共现度;以及所述三元组中的第一实体和第二实体的主题相似度。7.根据权利要求5所述的方法,其中,所述用于指示各三元组中的用户对该三元组中第二实体的兴趣度的特征值包括以下至少一者:该三元组中,第二实体的点击率;第二实体在预设分类表中所属的主题类别的点击率;所述三元组中的第一实体和第二实体的语义相似度。8.根据权利要求5所述的方法,其中,所述用于指示各三元组中的用户对该三元组中第二实体的预期度的特征值包括以下至少一者:基于所述三元组中用户的历史点击数据确定的用户和/或第一实体对第二实体的关系熟悉度;所述三元组中的第二实体相对用户和/或第一实体的意外度;以及所述三元组中,第一实体的点击多样性。9.一种实体推荐装置,包括:获取单元,配置用于响应于接收到用户对实体的搜索请求,获取与待搜索实体关联的候选实体集合;排序单元,配置用于将所述候选实体集合输入预先训练的排序模型,得到候选实体序列;以及推荐单元,配置用于从所述候选实体序列中选取候选实体,并向用户推荐所选取的候选实体;其中,所...

【专利技术属性】
技术研发人员:黄际洲丁世强王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1