一种文件检索的方法及设备技术

技术编号:26890657 阅读:20 留言:0更新日期:2020-12-29 16:07
本申请适用于数据处理技术领域,提供了一种文件检索的方法及设备,包括:基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。本申请减少了搜索耗时,提高了检索效率。

【技术实现步骤摘要】
一种文件检索的方法及设备
本申请属于数据处理
,尤其涉及一种文件检索的方法及设备。
技术介绍
随着法律知识的普及,广大民众与法律案件接触机会越来越多,因工作需要或个人兴趣等原因,用户可以选取特定的案件进行查阅。但由于法律案件数量众多,若需要用户进行手动筛选案件,则会大大增加了用户选取案件所需时长,从而增加了案件选取的难度。因此,如何提供高效的法律案件的检索手段则成为当前急需解决的问题。现有的法律案件的检索技术,主要采用基于关键词进行搜索,判断文本中是否存在用户输入的关键词,而由于法律案件往往包含的字数较多,需要对法律案件进行全文关键词搜索则需要较长响应时间,并且在法律案件数量庞大的情况下,上述搜索耗时会进一步提高,从而增加了文件检索的等待时长,降低了检索效率。
技术实现思路
有鉴于此,本申请实施例提供了一种文件检索的方法及设备,以解决现有的法律案件的检索技术,需要对法律案件进行全文关键词搜索,响应时间较长,并且在法律案件数量庞大的情况下,上述搜索耗时会进一步提高,增加了文件检索的等待时长,检索效率较低的问题。本申请实施例的第一方面提供了一种文件检索的方法,包括:基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。本申请实施例的第二方面提供了一种文件检索的设备,包括:数据包划分单元,用于基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;案件索引表创建单元,用于根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;数据包存储单元,用于基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;搜索关键词接收单元,用于基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;文件检索结果输出单元,用于根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。实施本申请实施例提供的一种文件检索的方法及设备具有以下有益效果:本申请实施例在存储历史案件时,根据法律知识图谱将历史案件划分为多个数据包,并分布式存储于多个不同的节点中,通过对应的案件索引表,可以从不同分布式存储节点提取关联的数据包,重新生成历史案件;在后续的关键词检索时,可以通过搜索关键词确定目标节点,该目标节点内存储有的数据包所对应的历史案件,即为本次搜索的目标案件,并生成文件检索结果,实现了文件检索的目的。与现有的法律案件的检索技术相比,由于不同的分布式存储节点存储有历史案件的数据包,且每个分布式存储节点内的数据包均对应同一知识节点,在后续搜索的过程中,无需进行全文搜索,确定搜索关键词关联的目标节点后,该目标节点存储有的数据包所对应的历史案件,即为本次检索的目标案件,从而大大减少了搜索耗时,提高了检索效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请第一实施例提供的一种文件检索的方法的实现流程图;图2是本申请第二实施例提供的一种文件检索的方法具体实现流程图;图3是本申请第三实施例提供的一种文件检索的方法S202具体实现流程图;图4是本申请一实施例提供的关联网络;图5是本申请第四实施例提供的一种文件检索的方法具体实现流程图;图6是本申请一实施例提供的案件关系树的结构示意图;图7是本申请第五实施例提供的一种文件检索的方法S101具体实现流程图;图8是本申请第六实施例提供的一种文件检索的方法S104具体实现流程图;图9是本申请第七实施例提供的一种文件检索的方法S105具体实现流程图;图10是本申请一实施例提供的一种文件检索的设备的结构框图;图11是本申请另一实施例提供的一种终端设备的示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例通过获取用户的用户信息,确定与用户存在关联关系的文档作为候选文档,对文档数据库内的文档进行初步筛选,并生成各个候选文档对应的文档特征向量;并根据每个用户对应的用户知识图谱以及用户信息内的浏览记录,生成用户特征向量,将文本特征向量以及用户特征向量进行导入到预设的推荐模型,从候选文档中确定出推荐文档,并生成包含上述推荐文档的推荐列表,输出给用户,实现了自动生成推荐列表的目的,解决了现有的法律文档的推荐技术,无法实现精准推荐,降低了推荐效率,增加了用户搜索感兴趣文档的耗时的问题。在本申请实施例中,流程的执行主体为终端设备。该终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等能够执行文件检索的任务的设备。图1示出了本申请第一实施例提供的文件检索的方法的实现流程图,详述如下:在S101中,基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包。在本实施例中,终端设备可以预存有法律知识图谱,该法律知识图谱可以通过云端服务器下载得到,该云端服务器下载得到的法律知识图谱,可以基于多个标准法律文本生成得到,例如根据刑法、民法以及宪法等标准法律文本,识别上述法律文本内包含的法律实体,基于各个法律实体之间的共同出现次数以及出现位置,建立不同法律实体之间的关联关系,从而构建得到上述的法律知识图谱。在一种可能的实现方式中,上述法律知识图谱还可以根据文档数据库内所有已有历史案件构建得到,同样地,终端设备可以识别上述历史案件内包含的法律实体,基于各个法律实体之间的共同出现次数以及出现位置,建立不同法律实体之间的关联关系,从而构建得到上述的法律知识图谱,在该情况下,本文档来自技高网...

【技术保护点】
1.一种文件检索的方法,其特征在于,包括:/n基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;/n根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;/n基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;/n基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;/n根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。/n

【技术特征摘要】
1.一种文件检索的方法,其特征在于,包括:
基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;
根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;
基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;
基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;
根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。


2.根据权利要求1所述的文件检索方法,其特征在于,在所述基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包之前,包括:
对案件数据库内的所有所述历史案件进行语义分析,得到多个法律实体;
基于标准法律文本对所述多个所述法律实体进行聚类操作,得到多个所述知识节点;
根据各个所述知识节点在所有所述历史案件内共现语段,建立所述知识节点之间的关联关系;
根据所述关联关系以及所述知识节点,生成所述法律知识图谱。


3.根据权利要求2所述的文件检索方法,其特征在于,所述基于标准法律文本对所述多个所述法律实体进行聚类操作,得到多个所述知识节点,包括:
在所述标准法律文本中确定各个所述法律实体的关联实体以及关联类型;
基于所述关联实体以及所述关联实体的所述关联类型,生成所述法律实体的关联网络;
若任意两个所述法律实体的所述关联网络之间的相似度大于预设的相似阈值,则识别所述两个法律实体存在别名关系;
将存在所述别名关系的多个所述法律实体聚类到同一所述知识节点。


4.根据权利要求1所述的文件检索方法,其特征在于,在所述基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包之前,包括:
获取案件数据库中各个所述历史案件的案件标签,并基于各个所述案件标签的标签等级,构建所述案件数据库对应的案件关系树;所述案件关系树内包含有多个分支节点;每个分支节点关联一个所述案件标签;
根据所述案件标签,将各个所述历史案件导入到关联的所述分支节点,并基于所述分支节点内包含所有历史案件的法律实体,建立所述分支节点的法律子图谱;
根据所有分支节点的所述法律子图谱以及所述案件关系树,生成所述法律知识图谱。


5.根据权利要求1-4任一项所述的文件检索方法,其特征在于,所述基于预设的法律知识图谱内包含...

【专利技术属性】
技术研发人员:王喆龙
申请(专利权)人:平安直通咨询有限公司上海分公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1