【技术实现步骤摘要】
一种信息推荐方法、装置、设备及计算机可读存储介质
[0001]本申请涉及计算机互联网领域中的人工智能技术,尤其涉及一种信息推荐方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]在信息推荐应用中,通常基于用户信息和推荐信息的关联程度进行信息推荐,即首先获取包括已推荐信息、用户信息和用户反馈的历史推荐数据,然后针对历史推荐数据训练出推荐模型,最后采用推荐模型向推荐用户推荐待推荐信息。然而,上述信息推荐的实现过程中,由于完成信息推荐到对推荐信息进行转化期间存在延迟的情况,因此所获取的用户反馈存在标签缺失或错误的情况,使得训练出的推荐模型的预测能力较差,进而在采用推荐模型进行信息推荐时,信息推荐的准确度较差。
技术实现思路
[0003]本申请实施例提供一种信息推荐方法、装置、设备及计算机可读存储介质,能够提升信息推荐的准确度。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种信息推荐方法,包括:
[0006]通过原始推荐模型进行信息推荐,获得推荐实 ...
【技术保护点】
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:通过原始推荐模型进行信息推荐,获得推荐实例序列对应的反馈信息序列,其中,所述反馈信息序列中的每条反馈信息包括延迟反馈奖励;获取所述推荐实例序列中的每个推荐实例对应的反馈修正参数,其中,所述反馈修正参数与当前收到所述每个推荐实例的延迟反馈的概率负相关、以及与最终收到所述每个推荐实例的延迟反馈的概率正相关;基于所述反馈修正参数,对所述每个推荐实例对应的所述延迟反馈奖励进行修正,从而获得与所述推荐实例序列对应的修正后的反馈信息序列;基于所述推荐实例序列和所述修正后的反馈信息序列,更新所述原始推荐模型,获得推荐模型,其中,所述推荐模型用于进行信息推荐。2.根据权利要求1所述的方法,其特征在于,所述获取所述推荐实例序列中的每个推荐实例对应的反馈修正参数,包括:获取所述推荐实例序列对应的收集时间段,并从所述收集时间段中确定反事实时间;从所述推荐实例序列中,选择所述收集时间段的起始时间与所述反事实时间之间推荐实例,获得观察实例序列;从所述观察实例序列中,选择所述延迟反馈奖励为延迟反馈奖励阈值的推荐实例,获得训练实例序列;针对所述推荐实例序列对应的推荐动作序列中的每个推荐动作,基于所述训练实例序列,训练出所述每个推荐动作的生存模型参数,从而获得与所述推荐动作序列对应的生存模型参数序列;基于所述生存模型参数序列和所述每个推荐实例对应的推荐动作,确定所述反馈修正参数。3.根据权利要求2所述的方法,其特征在于,所述每条反馈信息还包括反馈起始时间和流失时长;所述基于所述训练实例序列,训练出所述每个推荐动作的生存模型参数,包括:基于所述反馈起始时间和所述流失时长,确定反馈结束时间;基于所述反馈结束时间与所述反事实时间的比较结果,确定所述训练实例序列中每个训练实例对应的延迟反馈模拟奖励;将所述反事实时间与所述反馈起始时间之间的时长,确定为模拟反馈时长;将所述模拟反馈时长和所述流失时长中的最短时长,确定为所述每个训练实例对应的模拟流失时长,从而获得与所述每个训练实例对应的所述延迟反馈模拟奖励和所述模拟流失时长对;基于所述训练实例序列对应的所述延迟反馈模拟奖励和所述模拟流失时长对序列,训练出所述每个推荐动作的所述生存模型参数。4.根据权利要求2或3所述的方法,其特征在于,所述基于所述生存模型参数序列和所述每个推荐实例对应的推荐动作,确定所述反馈修正参数,包括:从所述生存模型参数序列中,确定与所述每个推荐实例对应的推荐动作所对应的目标生存模型参数;通过所述目标生存模型参数,确定所述每个推荐实例的生存信息;
获取与所述生存信息负相关的所述反馈修正参数。5.根据权利要求2或3所述的方法,其特征在于,所述从所述收集时间段中确定反事实时间,包括:基于所述收集时间段,确定收集时长;基于反事实参数,确定所述收集时长对应的模拟收集时长;基于所述收集时间段的起始时间和所述模拟收集时长,确定所述反事实时间。6.根据权利要求3所述的方法,其特征在于,所述基于所述反馈结束时间与所述反事实时间的比较结果,确定所述训练实例序列中每个训练实例对应的延迟反馈模拟奖励,包括:当所述反馈结束时间与所述反事实时间的所述比较结果为所述反馈结束时间早于所述反事实时间时,确定所述训练实例序列中所述每个训练实例对应的所述延迟反馈模拟奖励为第一奖励,其中,所述第一奖励表征已收到延迟反馈的奖励;当所述比较结果为所述反馈结束时间不早于所述反事实时间时,确定所述延迟反馈模拟奖励为第二奖励,其中,所述第二奖励表征未收到延迟反馈的奖励。7.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述推荐实例序列和所述...
【专利技术属性】
技术研发人员:徐君,张骁,贾浩男,苏函晶,王文瀚,文继荣,
申请(专利权)人:中国人民大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。