关联文档推荐方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29330630 阅读:13 留言:0更新日期:2021-07-20 17:48
本申请涉及一种关联文档推荐方法、装置、计算机设备和存储介质。所述方法包括:根据用户的浏览行为日志获取用户可能感兴趣的候选文档,且根据用户的浏览行为日志可以预估用户对于候选文档感兴趣的程度,即第一匹配度,再将候选文档的文档属性信息与当前浏览文档的文档属性信息进行进一步细致比对,将比对结果与第一匹配度整合形成候选文档与用户之间的第二匹配度,第二匹配度结合了用户的浏览行为日志以及候选文档与当前浏览文档之间的比对结果,通过第二匹配度可以更准确的为用户推荐满足用户喜好且与当前浏览文档相似度较高的关联文档。本方案无需将文档全文内容与候选文档的全文内容进行比对,减少了数据比对计算量,提高了推荐速率。

【技术实现步骤摘要】
关联文档推荐方法、装置、计算机设备和存储介质
本申请涉及计算机
,尤其涉及一种关联文档推荐方法、装置、计算机设备和存储介质。
技术介绍
文档管理系统用于管理常用office文档、pdf文档以及图片、视频等多媒体文档。用户可以在线查看各类文档,用户查看期间,系统自动推荐当前浏览内容的关联文档,可以帮助用户发现更多相关信息,进而满足用户的需求,提升系统的价值。但现有技术中为了推荐与当前浏览内容相关的关联文档,将当前浏览内容与文档全文内容进行相似性比对,首先,获取文档全文内容难度系数较高,不一定能获取到文档全文内容;其次,对全文内容进行相似性处理计算量大,浪费计算资源,也很难达到实时推荐的效果。
技术实现思路
为了解决上述技术问题,本申请提供了一种关联文档推荐方法、装置、计算机设备和存储介质。第一方面,本申请提供了一种关联文档推荐方法,包括:获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度;依照所述多个第二匹配度的降序顺序,推荐各个所述第二匹配度对应的候选文档。可选地,文档属性信息具有多个字段,所述将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度,包括:将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到多个字段相似度;将所述候选文档与所述当前浏览文档之间的全部字段相似度求和,得到所述候选文档与所述当前浏览文档之间的关联度。可选地,所述将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到多个字段相似度,包括:将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到所述候选文档中各个字段对应的内容相似度;根据字段与权重值之间的预设映射关系,确定所述候选文档中各个字段对应的目标权重值;将所述候选文档中各个字段对应的内容相似度与目标权重值相乘,得到所述候选文档中各个字段对应的字段相似度。可选地,所述将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度,包括:统计所述候选文档中的字段数量;将所述候选文档对应的第一匹配度与所述字段数量相乘,得到预估乘积;按照预设加权规则,对所述候选文档对应的关联度和预估乘积进行加权求和处理,得到所述候选文档与所述当前用户之间的第二匹配度,其中,所述预设加权规则用于按照第一预设权重对所述关联度进行加权,并按照第二预设权重对所述预估乘积进行加权。可选地,得到所述字段相似度之后,所述方法还包括:根据所述候选文档中各个字段对应的字段相似度以及所述字段携带的内容,生成各个字段对应的提示信息,其中,所述提示信息用于展示所述候选文档中的字段与所述当前浏览文档中相同字段之间的关联状态,所述关联状态用于表示相似状态或相同状态。可选地,所述依照各个第二匹配度的降序顺序,依次推荐并展示各个第二匹配度对应的候选文档之前,所述方法还包括:将包含相同提示信息的候选文档进行分类,得到多个文档集合,其中,每个所述文档集合对应一种提示信息,每个所述文档集合包括至少一个候选文档;在各个所述文档集合中,依照各个第二匹配度的降序顺序,依次推荐并展示各个第二匹配度对应的候选文档。可选地,得到多个文档集合之后,所述方法还包括:对各个所述文档集合中的候选文档进行去重处理,其中,去重后的一个候选文档仅属于一个文档集合;在去重处理结束的情况下,执行在各个所述文档集合中,依照各个第二匹配度的降序顺序,依次推荐并展示各个第二匹配度对应的候选文档的步骤。第二方面,本申请提供了一种关联文档推荐装置,包括:获取模块,用于获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;过滤召回模块,用于根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;比对模块,用于将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;整合模块,用于将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度;推荐模块,用于依照所述多个第二匹配度的降序顺序,推荐各个所述第二匹配度对应的候选文档。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度;依照所述多个第二匹配度的降序顺序,推荐各个所述第二匹配度对应的候选文档。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前本文档来自技高网...

【技术保护点】
1.一种关联文档推荐方法,其特征在于,所述方法包括:/n获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;/n根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;/n将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;/n将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度;/n依照多个所述第二匹配度的降序顺序,推荐各个所述第二匹配度对应的候选文档。/n

【技术特征摘要】
1.一种关联文档推荐方法,其特征在于,所述方法包括:
获取当前浏览文档的浏览信息,其中,所述浏览信息包括当前浏览文档的文档属性信息以及当前用户信息,所述用户信息包括当前用户的浏览行为日志;
根据所述浏览行为日志获取待推荐的候选文档,所述候选文档携带对应的文档属性信息以及所述候选文档与所述当前用户之间的第一匹配度;
将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度;
将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度;
依照多个所述第二匹配度的降序顺序,推荐各个所述第二匹配度对应的候选文档。


2.根据权利要求1所述的方法,其特征在于,所述文档属性信息具有多个字段,所述将所述当前浏览文档的文档属性信息与各个所述候选文档的文档属性信息进行比对,得到各个所述候选文档与所述当前浏览文档之间的关联度,包括:
将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到多个字段相似度;
将所述候选文档与所述当前浏览文档之间的全部字段相似度求和,得到所述候选文档与所述当前浏览文档之间的关联度。


3.根据权利要求2所述的方法,其特征在于,所述将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到多个字段相似度,包括:
将所述当前浏览文档中字段携带的内容与所述候选文档中相同字段携带的内容进行比对,得到所述候选文档中各个字段对应的内容相似度;
根据字段与权重值之间的预设映射关系,确定所述候选文档中各个字段对应的目标权重值;
将所述候选文档中各个字段对应的内容相似度与目标权重值相乘,得到所述候选文档中各个字段对应的字段相似度。


4.根据权利要求2所述的方法,其特征在于,所述将各个所述候选文档与所述当前用户之间的第一匹配度,以及各个所述候选文档与所述当前浏览文档之间的关联度,整合得到所述候选文档与所述当前用户之间的第二匹配度,包括:
统计所述候选文档中的字段数量;
将所述候选文档对应的第一匹配度与所述字段数量相乘,得到预估乘积;
按照预设加权规则,对所述候选文档对应的关联度和预估乘积进行加权求和处理,得到所述候选文档与所述当前用户之间的第二匹配度,其中,所述预设加权规则用于按照第一预设权重对所述关联度进行加权,并按照第二预设权重对所述预估乘积进行加权。

【专利技术属性】
技术研发人员:荆小兵霍京超曹雷
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1