一种推荐列表的生成方法及设备技术

技术编号:26890845 阅读:15 留言:0更新日期:2020-12-29 16:07
本申请适用于数据处理技术领域,提供了一种推荐列表的生成方法及设备,包括:基于目标用户的用户信息,从文档数据库内提取与用户信息关联的候选文档;基于预设的法律知识图谱,分别确定各个所述候选文档包含的法律实体,并根据所有所述法律实体各个候选文档的文本特征向量;获取目标用户的用户知识图谱,并通过用户知识图谱,生成目标用户的各个浏览记录对应的浏览知识路径;根据各个浏览记录对应的浏览内容,输出浏览内容的内容特征向量;根据所有浏览记录的内容特征向量以及浏览知识路径,生成目标用户的用户特征向量;根据用户特征向量以及文本特征向量确定推荐文档,生成推荐列表。本申请能提高了推荐文档选取的准确性,减少了用户搜索感兴趣文档的耗时。

【技术实现步骤摘要】
一种推荐列表的生成方法及设备
本申请属于数据处理
,尤其涉及一种推荐列表的生成方法及设备。
技术介绍
随着法律知识的普及,广大民众与法律文档接触机会越来越多,因工作需要或个人兴趣等原因,用户可以选取特定的文档进行查阅。但由于法律文档数量众多,若需要用户进行手动筛选文档,则会大大增加了用户选取文档所需时长,从而增加了文档选取的难度。因此,如何为用户推荐法律文档则成为当前急需解决的问题。现有的法律文档的推荐技术,主要采用关键词搜索的方式推荐法律文档,而由于法律采用大量标准化语言,同一关键词可以出现在多个不同领域的法律文档内,从而影响了推荐文档选取的准确性,无法实现精准推荐,降低了推荐效率,增加了用户搜索感兴趣文档的耗时。
技术实现思路
有鉴于此,本申请实施例提供了一种推荐列表的生成方法及设备,以解决现有的法律文档的推荐技术,无法实现精准推荐,降低了推荐效率,增加了用户搜索感兴趣文档的耗时的问题。本申请实施例的第一方面提供了一种推荐列表的生成方法,包括:基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档;所述用户信息包含所述目标用户的浏览记录;基于预设的法律知识图谱,分别确定各个所述候选文档包含的法律实体,并根据所有所述法律实体的文本特征向量;获取所述目标用户的用户知识图谱,并通过所述用户知识图谱,生成所述目标用户的各个浏览记录对应的内容特征向量;根据目标用户的用户信息,输出所述目标用户对应的用户属性向量;根据所有所述浏览记录的所述内容特征向量以及所述用户属性向量,生成所述目标用户的用户特征向量;根据所述用户特征向量以及所述文本特征向量,确定推荐文档,生成推荐列表。本申请实施例的第二方面提供了一种推荐列表的生成装置,包括:候选文档获取单元,用于基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档;所述用户信息包含所述目标用户的浏览记录;文本特征向量生成单元,用于基于预设的法律知识图谱,分别确定各个所述候选文档包含的法律实体,并根据所有所述法律实体的文本特征向量;内容特征向量生成单元,用于获取所述目标用户的用户知识图谱,并通过所述用户知识图谱,生成所述目标用户的各个浏览记录对应的内容特征向量;用户属性向量生成单元,用于根据目标用户的用户信息,输出所述目标用户对应的用户属性向量;用户特征向量生成单元,用于根据所有所述浏览记录的所述内容特征向量以及所述用户属性向量,生成所述目标用户的用户特征向量;推荐列表生成单元,用于根据所述用户特征向量以及所述文本特征向量,确定推荐文档,生成推荐列表。本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。实施本申请实施例提供的一种推荐列表的生成方法及设备具有以下有益效果:本申请实施例通过获取用户的用户信息,确定与用户存在关联关系的文档作为候选文档,对文档数据库内的文档进行初步筛选,并生成各个候选文档对应的文档特征向量;并根据每个用户对应的用户知识图谱以及用户信息内的浏览记录,生成用户特征向量,将文本特征向量以及用户特征向量进行导入到预设的推荐模型,从候选文档中确定出推荐文档,并生成包含上述推荐文档的推荐列表,输出给用户,实现了自动生成推荐列表的目的。与现有的推荐列表的生成技术相比,本申请实施例无需用户手动输入关键词,而是可以通过用户的浏览记录自动从文档数据库内提取出候选文档,并基于文档内容生成对应的文档特征向量,根据用户的浏览习惯以及感兴趣的内容配置用户特征向量,从而基于上述两个向量之间的匹配度,确定该候选文档的内容是否为用户关注的内容,选取出推荐文档,并生成了推荐列表,提高了推荐文档选取的准确性,减少了用户搜索感兴趣文档的耗时。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请第一实施例提供的一种推荐列表的生成方法的实现流程图;图2是本申请一实施例提供的确定推荐文档的流程图;图3是本申请第二实施例提供的一种推荐列表的生成方法S101具体实现流程图;图4是本申请一实施例提供的法律文档关系树的结构示意图;图5是本申请第三实施例提供的一种推荐列表的生成方法S101具体实现流程图;图6是本申请第四实施例提供的一种推荐列表的生成方法S103具体实现流程图;图7是本申请一实施例提供的浏览知识路径的生成示意图;图8是本申请第五实施例提供的一种推荐列表的生成方法S604具体实现流程图;图9是本申请第六实施例提供的一种推荐列表的生成方法S106具体实现流程图;图10是本申请第七实施例提供的一种推荐列表的生成方法具体实现流程图;图11是本申请一实施例提供的一种推荐列表的生成装置的结构框图;图12是本申请另一实施例提供的一种终端设备的示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例通过获取用户的用户信息,确定与用户存在关联关系的文档作为候选文档,对文档数据库内的文档进行初步筛选,并生成各个候选文档对应的文档特征向量;并根据每个用户对应的用户知识图谱以及用户信息内的浏览记录,生成用户特征向量,将文本特征向量以及用户特征向量进行导入到预设的推荐模型,从候选文档中确定出推荐文档,并生成包含上述推荐文档的推荐列表,输出给用户,实现了自动生成推荐列表的目的,解决了现有的法律文档的推荐技术,无法实现精准推荐,降低了推荐效率,增加了用户搜索感兴趣文档的耗时的问题。在本申请实施例中,流程的执行主体为终端设备。该终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等能够执行推荐列表的生成任务的设备。图1示出了本申请第一实施例提供的推荐列表的生成方法的实现流程图,详述如下:在S101中,基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档;所述用户信息包含所述目标用户的浏览记录。在本实施例中,终端设备可以根据目标用户的用户标识,从用户数据库内获取到与目标用户关联的用户信息。该用户信息包含有目标用户的浏览记录,每个浏览记录对应相关的浏览内容,该浏览内容可以是文档数据库内已经存储有的已有文档,也可以是互联网上的文章。可选地,该用户信息还可以包含用本文档来自技高网...

【技术保护点】
1.一种推荐列表的生成方法,其特征在于,包括:/n基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档;所述用户信息包含所述目标用户的浏览记录;/n基于预设的法律知识图谱,分别确定各个所述候选文档包含的法律实体,并根据所有所述法律实体的文本特征向量;/n获取所述目标用户的用户知识图谱,并通过所述用户知识图谱,生成所述目标用户的各个浏览记录对应的内容特征向量;/n根据目标用户的用户信息,输出所述目标用户对应的用户属性向量;/n根据所有所述浏览记录的所述内容特征向量以及所述用户属性向量,生成所述目标用户的用户特征向量;/n根据所述用户特征向量以及所述文本特征向量,确定推荐文档,生成推荐列表。/n

【技术特征摘要】
1.一种推荐列表的生成方法,其特征在于,包括:
基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档;所述用户信息包含所述目标用户的浏览记录;
基于预设的法律知识图谱,分别确定各个所述候选文档包含的法律实体,并根据所有所述法律实体的文本特征向量;
获取所述目标用户的用户知识图谱,并通过所述用户知识图谱,生成所述目标用户的各个浏览记录对应的内容特征向量;
根据目标用户的用户信息,输出所述目标用户对应的用户属性向量;
根据所有所述浏览记录的所述内容特征向量以及所述用户属性向量,生成所述目标用户的用户特征向量;
根据所述用户特征向量以及所述文本特征向量,确定推荐文档,生成推荐列表。


2.根据权利要求1所述的生成方法,其特征在于,所述基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档,包括:
获取所述文档数据库内各个已有文档的法律类别标签;
根据各个所述法律类别标签之间的级联关系,生成所述文档数据库对应的法律文档关系树;所述法律文档关系树包含多个标签节点;每个标签节点关联至少一个所述已有文档;
基于所有所述浏览记录的浏览内容对应的用户标签,从所述法律文档关系树内选取所述目标用户关联的所述标签节点;
将关联的所述标签节点内的所述已有文档作为所述目标用户的所述候选文档。


3.根据权利要求1所述的生成方法,其特征在于,所述用户信息包含所述目标用户的待处理任务,则所述基于目标用户的用户信息,从文档数据库内提取与所述用户信息关联的候选文档,包括:
根据所述待处理任务,生成所述目标用户对应的任务特征向量;
对所述文档数据库内各个已有文档进行语义分析,分别确定各个所述已有文档包含的法律实体;
基于所述法律实体,分别构建各个所述已有文档的法律实体向量;
计算所述任务特征向量以及所述法律实体向量之间的相似度,选取所述相似度大于预设的相似阈值的所述已有文档,作为所述候选文档。


4.根据权利要求1所述的生成方法,其特征在于,所述获取所述目标用户的用户知识图谱,并通过所述用户知识图谱,生成所述目标用户的各个浏览记录对应的内容特征向量,包括:
对所述浏览记录对应的浏览内容进行语义分析,提取所述浏览内容包含的内容实体;
分别从所述用户知识图谱内识别出与所述内容实体匹配的知识节点;
在所述用户知识图谱内确定连接各个所述知识节点的子路径,将所有所述子路径进行合并,得到浏览知识路径;
基于所述浏览知识路径,生成所述浏览记录对应的内容特征向量。


5.根据权利要求4所述的生成方法,其特征在于,所述基于所述浏览知识路径,生成所述浏览记录对应的内容特征向量,包括:
确定所述浏览知识路径内包含的所述知识节点在所述用户知识图谱内的关联节点;
基于所述关联节点生成所述知识节点对应的关联节点...

【专利技术属性】
技术研发人员:赵琪
申请(专利权)人:平安直通咨询有限公司上海分公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1