推荐信息穿插位置确定方法、系统、设备及存储介质技术方案

技术编号:24575065 阅读:51 留言:0更新日期:2020-06-21 00:15
本发明专利技术提供了一种推荐信息穿插位置确定方法、系统、设备及存储介质,该方法包括采用强化学习对穿插位置进行迭代训练,其中,将推荐信息穿插在各个位置分别作为一个动作,并且在每一轮迭代训练中执行如下步骤:根据用户的搜索条件生成排序列表,并获取推荐信息;根据当前迭代执行的动作,将推荐信息插入所述排序列表;经过预设时间段后,统计每个动作所对应的反馈量;根据所述反馈量计算每个动作的偏好值;根据所述偏好值选择执行的动作,并将选择的动作作为下一轮迭代执行的动作。本发明专利技术基于强化学习方式确定推荐信息的穿插位置,可以提升司机在搜货过程中的体验,使得穿插货源的观感更加自然贴合司机的搜货直觉,提升了用户的使用体验。

Method, system, equipment and storage medium for determining the location of recommended information interleaving

【技术实现步骤摘要】
推荐信息穿插位置确定方法、系统、设备及存储介质
本专利技术涉及搜索
,尤其涉及一种推荐信息穿插位置确定方法、系统、设备及存储介质。
技术介绍
司机用户在物流服务平台中搜索路线和货源时,平台会召回根据司机的搜索条件完全匹配的货源而形成智能排序主搜列表,除此之外,为了给司机用户更好的使用体验和更多的选择,还会根据司机的搜索和司机的偏好等为司机推荐一些货源。这些推荐信息会穿插在智能排序主搜列表中,因此会占用一些曝光位。现有技术中的推荐信息穿插方法中,是固定一个展示位为穿插位置,将推荐信息插入到该穿插位置。然而这种固定穿插位置的方式,没有考虑不同司机用户自身偏好程度与所在搜货路线的因素,对于部分只跑固定线路的司机或是所在路线存在其显著的地域性特点时,显性策略无法做出灵活调整,导致可能会出现占用过多优质曝光位而影响用户使用体验的问题。现有技术中有一些自适应筛选路线的方案,然而该方法是在路线召回阶段针对现有的几套策略进行更快的在线筛选,是对策略集的选择,不具有普适性,并且难以长期适应新的路线变化或搜索场景的变化。专
技术实现思路
针本文档来自技高网
...

【技术保护点】
1.一种推荐信息穿插位置确定方法,其特征在于,包括采用强化学习对穿插位置进行迭代训练,其中,将推荐信息穿插在各个位置分别作为一个动作,并且在每一轮迭代训练中执行如下步骤:/n接收用户的搜索条件,根据所述搜索条件生成排序列表,并获取推荐信息;/n根据当前迭代执行的动作,将推荐信息插入所述排序列表对应的穿插位置;/n经过预设时间段后,统计每个动作所对应的反馈量;/n根据所述反馈量计算每个动作的偏好值;/n根据所述偏好值选择执行的动作,并将选择的动作作为下一轮迭代执行的动作。/n

【技术特征摘要】
1.一种推荐信息穿插位置确定方法,其特征在于,包括采用强化学习对穿插位置进行迭代训练,其中,将推荐信息穿插在各个位置分别作为一个动作,并且在每一轮迭代训练中执行如下步骤:
接收用户的搜索条件,根据所述搜索条件生成排序列表,并获取推荐信息;
根据当前迭代执行的动作,将推荐信息插入所述排序列表对应的穿插位置;
经过预设时间段后,统计每个动作所对应的反馈量;
根据所述反馈量计算每个动作的偏好值;
根据所述偏好值选择执行的动作,并将选择的动作作为下一轮迭代执行的动作。


2.根据权利要求1所述的推荐信息穿插位置确定方法,其特征在于,在第一轮迭代训练开始时,随机选择当前迭代执行的动作。


3.根据权利要求1所述的推荐信息穿插位置确定方法,其特征在于,采用如下公式计算每个动作的偏好值:
Q(ai)=(Q(ai)*ts+Rt(ai))/ts
其中,Q(ai)为第i个动作的偏好值,i∈(1,n),n为动作的总数量,Rt(ai)为第i个动作的反馈量,ts为预设时间段的时间长度。


4.根据权利要求1所述的推荐信息穿插位置确定方法,其特征在于,所述根据所述反馈量计算每个动作的偏好值之后,还包括如下步骤:
统计预设时间段内每个动作所对应的执行次数;
根据每个动作所对应的执行次数对每个动作的偏好值进行修正。


5.根据权利要求4所述的推荐信息穿插位置确定方法,其特征在于,采用如下公式对每个动作的偏好值进行修正:
Q(ai)’=Q(ai)+k1*[(log(T_all)/T_ai)*k2]
其中,Q(ai)’为第i个动作的修正后偏好值,Q(ai)为第i个动作的修正前偏好值,T_all为预设时间段内所有动作的总执行次数,T_ai为预设时间段内第i个动作的执行次数,k1和k2为预设系数。


6.根据权利要求1所述的推荐信息穿插位置确定方法,其特征在于,所述根据所述偏好值...

【专利技术属性】
技术研发人员:李轩增
申请(专利权)人:江苏满运软件科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1