基于MHT算法的文章推荐方法、装置、设备及存储介质制造方法及图纸

技术编号:34713919 阅读:19 留言:0更新日期:2022-08-31 17:55
本申请实施例提供了一种基于MHT算法的文章推荐方法、装置、设备及存储介质,涉及人工智能技术中的网络媒体领域。该方法包括:接收推荐请求,用于请求T个推荐文章,T>1;响应于该推荐请求,从收集的M个文章样本中选择N个候选样本,M≥N≥1;基于该每一个文章样本的分数,从该N个候选样本中选择K个文章样本,并将该K个文章样本确定为K个根节点,N≥K≥1;基于该K个根节点,利用MHT算法按照确定该T个推荐文章:输出该T个推荐文章。该方法能够提升用户的体验效果、提升推荐的灵活性和可控性、保证轨迹遍历的完整性,降低遍历的时间复杂度,有利于提升MHT模型的实效性,也有利于引入更复杂的模型。的模型。的模型。

【技术实现步骤摘要】
基于MHT算法的文章推荐方法、装置、设备及存储介质


[0001]本申请实施例涉及人工智能技术中的网络媒体领域,并且更具体地,涉及基于MHT算法的文章推荐方法、装置、设备及存储介质。

技术介绍

[0002]近年来,随着信息技术的快速发展,各种各样的资讯信息呈爆炸式增长,用户无法从海量的信息中快速获得对自己真正有意义的信息。因此,个性化的文章推荐成为了一项重要的研究课题。
[0003]通常,利用文章推荐系统推荐用户感兴趣的文章。文章推荐系统中的重排模块用于通过一些策略尽量来权衡文章的多样性和文章与用户兴趣的匹配程度。重排模块一般采用流式处理方式和批式处理方式对多个文章的用于表征用户兴趣和文章的匹配程度的分数进行选择和打散。流式处理方式为基于规则对排序后的文章进行收集,并配合降级策略保证收集的数目。批式处理方式先按照收集策略策略进行收集,然后按照打散策略进行微调。但是,流式处理方式存在严重的收集实效性问题,此外,通过配合降级策略保证收集的数目,影响体验。批式处理方式容易使得后面的规则打破前面的规则,导致推荐的可解释性差的问题,非常容易出现不合理的顺序,严重影响用户的体验效果。

技术实现思路

[0004]本申请实施例提供了一种基于MHT算法的文章推荐方法、装置、设备及存储介质,能够提升用户的体验效果、提升推荐的灵活性和可控性、保证轨迹遍历的完整性,降低遍历的时间复杂度,有利于提升MHT模型的实效性,也有利于引入更复杂的模型。
[0005]一方面,提供了一种
[0006]接收推荐请求,该推荐请求用于请求T个推荐文章,T>1;
[0007]响应于该推荐请求,从收集的M个文章样本中选择N个候选样本,该M个文章样本中的每一个文章样本具有对应的用于表征用户兴趣和文章样本的匹配程度的分数,M≥N≥1;
[0008]基于该每一个文章样本的分数,从该N个候选样本中选择K个文章样本,并将该K个文章样本确定为K个根节点,N≥K≥1;
[0009]基于该K个根节点,按照以下方式确定该T个推荐文章:
[0010]基于每一个父节点,在该M个文章样本中的除该父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中,选择相对该父节点的收益评分靠前的X个文章样本作为该父节点的X个子节点;将该X个子节点中的每一个子节点作为新的父节点继续延展子节点,直至叶子节点所在的层次为T时,将所有叶子节点所在的轨迹中收益评分最大的目标轨迹上的T个文章样本确定为该T个推荐文章;
[0011]输出该T个推荐文章。
[0012]另一方面,提供了一种
[0013]接收单元,用于接收推荐请求,该推荐请求用于请求T个推荐文章,T≥1;
[0014]选择单元,用于响应于该推荐请求,从收集的M个文章样本中选择N个候选样本,该M个文章样本中的每一个文章样本具有对应的用于表征用户兴趣和文章样本的匹配程度的分数,M≥N≥1;
[0015]确定单元,用于:
[0016]基于该每一个文章样本的分数,从该N个候选样本中选择K个文章样本,并将该K个文章样本确定为K个根节点,N≥K≥1;
[0017]基于该K个根节点,按照以下方式确定该T个推荐文章:
[0018]基于每一个父节点,在该M个文章样本中的除该父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中,选择相对该父节点的收益评分靠前的X个文章样本作为该父节点的X个子节点;将该X个子节点中的每一个子节点作为新的父节点继续延展子节点,直至叶子节点所在的层次为T时,将所有叶子节点所在的轨迹中收益评分最大的目标轨迹上的T个文章样本确定为该T个推荐文章;
[0019]输出单元,用于输出该T个推荐文章。
[0020]另一方面,本申请提供了一种电子设备,包括:
[0021]处理器,适于实现计算机指令;以及,
[0022]计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令适于由处理器加载并执行上述基于MHT算法的文章推荐方法。
[0023]另一方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,该计算机指令被计算机设备的处理器读取并执行时,使得计算机设备执行上述基于MHT算法的文章推荐方法。
[0024]另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述基于MHT算法的文章推荐方法。
[0025]本申请实施例中,基于MHT算法确定该T个推荐文章,与批式处理的串行处理方式相比,能够使得每次收集时都考虑了所有的条件,避免出现不合理的顺序,比如同质的内容相邻,降低了用户获取信息的体验,进而能够保证召回模块和排序模块的能力,提升用户的体验效果。此外,与流式处理的降级策略相比,通过量化的记分方式选择最终推荐的文章,最终推荐给用户的文章更加灵活和可控。此外,基于N个候选样本中选择的K个文章样本,使用MHT算法收集T个推荐文章,即以在N个候选样本中中选择K个文章样本(即种子节点)作为根节点延展子节点,能够保证轨迹遍历的完整性,降低遍历的时间复杂度,有利于提升MHT模型的实效性,也有利于引入更复杂的模型;例如,即使引入更复杂的用于计算收益评分的模型,以在N个候选样本中中选择K个文章样本作为根节点延展子节点,也能够在保证轨迹遍历的完整性的基础上,避免遍历的时间过长。简言之,本申请实施例提供的方案,能够提升用户的体验效果、提升推荐的灵活性和可控性、保证轨迹遍历的完整性,降低遍历的时间复杂度,有利于提升MHT模型的实效性,也有利于引入更复杂的模型。
附图说明
[0026]图1是本申请实施例提供的系统框架的示例。
[0027]图2是本申请实施例提供的基于MHT算法的文章推荐方法的示意性流程图。
[0028]图3是本申请实施例提供的基于MHT算法的文章推荐方法的示例。
[0029]图4是本申请实施例提供的基于MHT算法的文章推荐装置的示例。
[0030]图5是本申请实施例提供的电子设备的示意性框图。
具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0032]本申请提供的方案可涉及人工智能技术。
[0033]其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多假设跟踪MHT算法的文章推荐方法,其特征在于,包括:接收推荐请求,所述推荐请求用于请求T个推荐文章,T>1;响应于所述推荐请求,从收集的M个文章样本中选择N个候选样本,所述M个文章样本中的每一个文章样本具有对应的用于表征用户兴趣和文章样本的匹配程度的分数,M≥N≥1;基于所述每一个文章样本的分数,从所述N个候选样本中选择K个文章样本,并将所述K个文章样本确定为K个根节点,N≥K≥1;基于所述K个根节点,按照以下方式确定所述T个推荐文章:基于每一个父节点,在所述M个文章样本中的除所述父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中,选择相对所述父节点的收益评分靠前的X个文章样本作为所述父节点的X个子节点;将所述X个子节点中的每一个子节点作为新的父节点继续延展子节点,直至叶子节点所在的层次为T时,将所有叶子节点所在的轨迹中收益评分最大的目标轨迹上的T个文章样本确定为所述T个推荐文章;输出所述T个推荐文章。2.根据权利要求1所述的方法,其特征在于,所述X个子节点所在的层次为目标层次,所述目标层次中可作为所述新的父节点的子节点的数量为预设的最大数量Y≥K;其中,所述将所述X个子节点中的每一个子节点作为新的父节点继续延展子节点,包括:当目标层次中的子节点的数量大于或等于Y时,在所述目标层次中的子节点中选择Y个子节点;将所述Y个子节点中的每一个子节点,作为所述新的父节点继续延展子节点。3.根据权利要求2所述的方法,其特征在于,所述在所述目标层次中的子节点中选择Y个子节点,包括:确定所述目标层次中的所有子节点所在的轨迹中的收益评分靠前的Y个轨迹;将所述目标层次中的所述Y个轨迹上的子节点,确定为所述Y个子节点。4.根据权利要求1所述的方法,其特征在于,所述基于每一个父节点,在所述M个文章样本中的除所述父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中,选择相对所述父节点的收益评分靠前的X个文章样本作为所述父节点的X个子节点之前,所述方法还包括:按照以下方式,确定所述剩余文章样本中的第一文章样本相对所述父节点的收益评分:获取用于表征所述第一文章样本和用户兴趣的匹配程度的第一分数;基于所述X个子节点所在的层次,确定所述第一文章样本的时间延迟分数;获取用于表征所述第一文章样本和所述所述父节点上的文章样本之间的关系的第二分数;将所述第一分数乘以所述时间延迟分数后得到的值与所述第二分数的差值,确定为所述第一文章样本相对所述父节点的的收益评分。5.根据权利要求4所述的方法,其特征在于,所述基于所述X个子节点所在的层次,确定所述第一文章样本的时间延迟分数,包括;将所述X个子节点所在的层次和预设的延迟系数相乘,得到第一延迟分数;将1与所述第一延迟分数的差值,确定为所述第一文章样本的时间延迟分数。
6.根据权利要求4所述的方法,其特征在于,所述获取用于表征所述第一文章样本和所述所述父节点上的文章样本之间的关系的第二分数之前,所述方法还包括:存储二元关系,所述二元关系包括所述M个文章样本中的任意两个文章样本对应的用于表征所述所述任意两...

【专利技术属性】
技术研发人员:张新宇赵铭
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1