基于MHT算法的文章推荐方法、装置、设备及存储介质制造方法及图纸

技术编号：34713919 阅读：19 留言：0更新日期：2022-08-31 17:55

本申请实施例提供了一种基于MHT算法的文章推荐方法、装置、设备及存储介质，涉及人工智能技术中的网络媒体领域。该方法包括：接收推荐请求，用于请求T个推荐文章，T＞1；响应于该推荐请求，从收集的M个文章样本中选择N个候选样本，M≥N≥1；基于该每一个文章样本的分数，从该N个候选样本中选择K个文章样本，并将该K个文章样本确定为K个根节点，N≥K≥1；基于该K个根节点，利用MHT算法按照确定该T个推荐文章：输出该T个推荐文章。该方法能够提升用户的体验效果、提升推荐的灵活性和可控性、保证轨迹遍历的完整性，降低遍历的时间复杂度，有利于提升MHT模型的实效性，也有利于引入更复杂的模型。的模型。的模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于MHT算法的文章推荐方法、装置、设备及存储介质

[0001]本申请实施例涉及人工智能技术中的网络媒体领域，并且更具体地，涉及基于MHT算法的文章推荐方法、装置、设备及存储介质。

技术介绍

[0002]近年来，随着信息技术的快速发展，各种各样的资讯信息呈爆炸式增长，用户无法从海量的信息中快速获得对自己真正有意义的信息。因此，个性化的文章推荐成为了一项重要的研究课题。
[0003]通常，利用文章推荐系统推荐用户感兴趣的文章。文章推荐系统中的重排模块用于通过一些策略尽量来权衡文章的多样性和文章与用户兴趣的匹配程度。重排模块一般采用流式处理方式和批式处理方式对多个文章的用于表征用户兴趣和文章的匹配程度的分数进行选择和打散。流式处理方式为基于规则对排序后的文章进行收集，并配合降级策略保证收集的数目。批式处理方式先按照收集策略策略进行收集，然后按照打散策略进行微调。但是，流式处理方式存在严重的收集实效性问题，此外，通过配合降级策略保证收集的数目，影响体验。批式处理方式容易使得后面的规则打破前面的规则，导致推荐的可解释性差的问题，非常容易出现不合理的顺序，严重影响用户的体验效果。

技术实现思路

[0004]本申请实施例提供了一种基于MHT算法的文章推荐方法、装置、设备及存储介质，能够提升用户的体验效果、提升推荐的灵活性和可控性、保证轨迹遍历的完整性，降低遍历的时间复杂度，有利于提升MHT模型的实效性，也有利于引入更复杂的模型。
[0005]一方面，提供了一种
[0006]接收推荐请求，该...

【技术保护点】

【技术特征摘要】
1.一种基于多假设跟踪MHT算法的文章推荐方法，其特征在于，包括：接收推荐请求，所述推荐请求用于请求T个推荐文章，T＞1；响应于所述推荐请求，从收集的M个文章样本中选择N个候选样本，所述M个文章样本中的每一个文章样本具有对应的用于表征用户兴趣和文章样本的匹配程度的分数，M≥N≥1；基于所述每一个文章样本的分数，从所述N个候选样本中选择K个文章样本，并将所述K个文章样本确定为K个根节点，N≥K≥1；基于所述K个根节点，按照以下方式确定所述T个推荐文章：基于每一个父节点，在所述M个文章样本中的除所述父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中，选择相对所述父节点的收益评分靠前的X个文章样本作为所述父节点的X个子节点；将所述X个子节点中的每一个子节点作为新的父节点继续延展子节点，直至叶子节点所在的层次为T时，将所有叶子节点所在的轨迹中收益评分最大的目标轨迹上的T个文章样本确定为所述T个推荐文章；输出所述T个推荐文章。2.根据权利要求1所述的方法，其特征在于，所述X个子节点所在的层次为目标层次，所述目标层次中可作为所述新的父节点的子节点的数量为预设的最大数量Y≥K；其中，所述将所述X个子节点中的每一个子节点作为新的父节点继续延展子节点，包括：当目标层次中的子节点的数量大于或等于Y时，在所述目标层次中的子节点中选择Y个子节点；将所述Y个子节点中的每一个子节点，作为所述新的父节点继续延展子节点。3.根据权利要求2所述的方法，其特征在于，所述在所述目标层次中的子节点中选择Y个子节点，包括：确定所述目标层次中的所有子节点所在的轨迹中的收益评分靠前的Y个轨迹；将所述目标层次中的所述Y个轨迹上的子节点，确定为所述Y个子节点。4.根据权利要求1所述的方法，其特征在于，所述基于每一个父节点，在所述M个文章样本中的除所述父节点所在的轨迹中已选择的文章样本之外的剩余文章样本中，选择相对所述父节点的收益评分靠前的X个文章样本作为所述父节点的X个子节点之前，所述方法还包括：按照以下方式，确定所述剩余文章样本中的第一文章样本相对所述父节点的收益评分：获取用于表征所述第一文章样本和用户兴趣的匹配程度的第一分数；基于所述X个子节点所在的层次，确定所述第一文章样本的时间延迟分数；获取用于表征所述第一文章样本和所述所述父节点上的文章样本之间的关系的第二分数；将所述第一分数乘以所述时间延迟分数后得到的值与所述第二分数的差值，确定为所述第一文章样本相对所述父节点的的收益评分。5.根据权利要求4所述的方法，其特征在于，所述基于所述X个子节点所在的层次，确定所述第一文章样本的时间延迟分数，包括；将所述X个子节点所在的层次和预设的延迟系数相乘，得到第一延迟分数；将1与所述第一延迟分数的差值，确定为所述第一文章样本的时间延迟分数。
6.根据权利要求4所述的方法，其特征在于，所述获取用于表征所述第一文章样本和所述所述父节点上的文章样本之间的关系的第二分数之前，所述方法还包括：存储二元关系，所述二元关系包括所述M个文章样本中的任意两个文章样本对应的用于表征所述所述任意两...

【专利技术属性】
技术研发人员：张新宇，赵铭，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人