【技术实现步骤摘要】
实时与离线结合的文档推荐方法、装置、设备及介质
[0001]本专利技术涉及文档推荐
,尤其涉及一种实时与离线结合的文档推荐方法、装置、设备及介质。
技术介绍
[0002]随着文档数量的海量增加,为了增加文档的阅读流量,在展示用户点击的文档时,都会展示一个文档推荐列表。目前的文档推荐列表的生成面对海量的文档,计算时间久,极易内存溢出,为了解决该问题,采用离线文档推荐方法。离线文档推荐方法在访问低峰时启动计算,新生成的文档无法获得推荐,而用户点击新生成的文档时将无法获得文档推荐列表。
技术实现思路
[0003]基于此,有必要针对目前的离线文档推荐方法,新生成的文档无法获得推荐、用户点击新生成的文档时将无法获得文档推荐列表的技术问题,提出了一种实时与离线结合的文档推荐方法、装置、设备及介质。
[0004]本申请提供了一种实时与离线结合的文档推荐方法,所述方法包括:获取文档推荐请求,其中,所述文档推荐请求携带有目标用户标识和目标点击文档标识;根据所述目标点击文档标识,从预设的离线推荐库中查询缓存推荐列表 ...
【技术保护点】
【技术特征摘要】
1.一种实时与离线结合的文档推荐方法,所述方法包括:获取文档推荐请求,其中,所述文档推荐请求携带有目标用户标识和目标点击文档标识;根据所述目标点击文档标识,从预设的离线推荐库中查询缓存推荐列表,作为第一列表;根据预设的近线推荐策略和所述目标用户标识,从预设的近线推荐池中确定实时推荐列表,作为第二列表;对所述第一列表和所述第二列表进行组合,得到目标文档推荐列表。2.根据权利要求1所述的实时与离线结合的文档推荐方法,其特征在于,所述近线推荐池的更新步骤包括:获取新文档处理请求,所述新文档处理请求携带有新文档标识;从预设的离线启动时间列表获取未来的且距离所述新文档处理请求对应的请求生成时间最近的离线启动时间,作为待分析时间;将所述待分析时间减去所述请求生成时间,得到时间差值;判断所述时间差值是否小于预设时长;若是,则对所述新文档标识对应的文档进行是否进入所述近线推荐池的判断,得到目标判断结果,若所述目标判断结果为是,则将所述新文档标识对应的文档添加到所述近线推荐池,若所述目标判断结果为否,则将所述新文档标识对应的文档添加到离线推荐池;若否,则将所述新文档标识对应的文档添加到所述近线推荐池。3.根据权利要求2所述的实时与离线结合的文档推荐方法,其特征在于,所述对所述新文档标识对应的文档进行是否进入所述近线推荐池的判断,得到目标判断结果的步骤,包括:采用预设的文档类别分类模型,对所述新文档标识对应的文档进行文档分类,得到文档分类结果;获取所述文档分类结果对应的在线用户数量;判断所述文档分类结果对应的所述在线用户数量是否大于预设的第一用户数量;若是,则确定所述目标判断结果为是;若否,则确定所述目标判断结果为否。4.根据权利要求2所述的实时与离线结合的文档推荐方法,其特征在于,所述对所述新文档标识对应的文档进行是否进入所述近线推荐池的判断,得到目标判断结果的步骤,还包括:采用预设的关键词分词词典,对所述新文档标识对应的文档进行分词,得到关键词集;根据预设的热词集,判断所述关键词集中是否存在为热词的关键词;若存在,则确定所述目标判断结果为是;若不存在,则确定所述目标判断结果为否。5.根据权利要求2所述的实时与离线结合的文档推荐方法,其特征在于,所述缓存推荐列表包括固定推荐子表和离线推荐子表;所述将所述新文档标识对应的文档添加到所述近线推荐池的步骤,包括:将所述新文档标识对应的文档添加到所述近线推荐池,并且在所述近线推荐池中,对
所述新文档标识对应的文档打上预设的未处理标签;所述近线推荐池的更新步骤还包括:从所述近线推荐池中,找出添加时间超过预设的第一时长且携带有所述未处理标签的文档,作为第一待分析文档,并获取所述第一待分析文档对应的第一历史推荐数据及第一历史跳转数据;根据预设的预测模型、所述第一历史推荐数据和所述第一历史跳转数据进行推荐数量预测和跳转数量预测,得到第一推荐数量和第一跳转数量;若所述第一推荐数量大于或等于预设的第一推荐阈值,并且,所述第一跳转数量大于或等于预设的第一点击阈值,则将所述第一待分析文档删除所述未处理标签后添加到预设的旧文档库中,将所述第一待分析文档从所述近线推荐池中删除,将所述第一历史推荐数据对应的每个点击文档作为第一添加文档,将所述第一待分析文档对应的文档标识添加到所述第一添加文档对应的所述固定推荐子表中,将所述第一添加文档对应的文档标识添加到所述第一待分析文档对应的所述固定推荐子表中;若所述第一推荐数量小于或等于预设的第二推荐阈值,并且,所述第一跳转数量小于或等于预设的第二点击阈值,则将所述第一待分析文档删除所述未处理标签后添加到所述离线推荐池中,将所述第一待分析文档从所述近线推荐池中删除;若所述第一推荐数量大于所述第二推荐阈值及小于所述第一推荐阈值,并且,所述第一跳转数量大于所述第二点击阈值及小于所述第一点击阈值,则在所述近线推荐池中,对所述第一待分析文档删除所述未处理标签;从所述近线推荐池中,找出添加时间超过预设的第二时长且不携带有所述未处理标签的文档,作为第二待分析文档,并获取所述第二待分析文档对应的第二历史推荐数据及第二历史跳转数据;根据所述第二历史推荐数据计算第二推荐数量,根据...
【专利技术属性】
技术研发人员:朱建伟,
申请(专利权)人:长沙开发者科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。