【技术实现步骤摘要】
一种文件检索的方法及设备
本申请属于数据处理
,尤其涉及一种文件检索的方法及设备。
技术介绍
随着法律知识的普及,广大民众与法律案件接触机会越来越多,因工作需要或个人兴趣等原因,用户可以选取特定的案件进行查阅。但由于法律案件数量众多,若需要用户进行手动筛选案件,则会大大增加了用户选取案件所需时长,从而增加了案件选取的难度。因此,如何提供高效的法律案件的检索手段则成为当前急需解决的问题。现有的法律案件的检索技术,主要采用基于关键词进行搜索,判断文本中是否存在用户输入的关键词,而由于法律案件往往包含的字数较多,需要对法律案件进行全文关键词搜索则需要较长响应时间,并且在法律案件数量庞大的情况下,上述搜索耗时会进一步提高,从而增加了文件检索的等待时长,降低了检索效率。
技术实现思路
有鉴于此,本申请实施例提供了一种文件检索的方法及设备,以解决现有的法律案件的检索技术,需要对法律案件进行全文关键词搜索,响应时间较长,并且在法律案件数量庞大的情况下,上述搜索耗时会进一步提高,增加了文件检索的等待时长,检索效率较低的问题。本申请实施例的第一方面提供了一种文件检索的方法,包括:基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所 ...
【技术保护点】
1.一种文件检索的方法,其特征在于,包括:/n基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;/n根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;/n基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;/n基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;/n根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。/n
【技术特征摘要】
1.一种文件检索的方法,其特征在于,包括:
基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包;
根据各个数据包关联的知识节点,创建所述历史案件对应的案件索引表;每个所述知识节点关联有对应的分布式存储节点;所述案件索引表用于存储所述分布式存储节点的网络地址;
基于所述案件索引表,将所述历史案件的各个所述数据包存储于关联的所述分布式存储节点;
基于接收到的搜索关键词,确定所述法律知识图谱中与所述搜索关键词关联的目标节点;
根据所述目标节点对应的所述分布式存储节点内包含有的历史案件,生成文件检索结果。
2.根据权利要求1所述的文件检索方法,其特征在于,在所述基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包之前,包括:
对案件数据库内的所有所述历史案件进行语义分析,得到多个法律实体;
基于标准法律文本对所述多个所述法律实体进行聚类操作,得到多个所述知识节点;
根据各个所述知识节点在所有所述历史案件内共现语段,建立所述知识节点之间的关联关系;
根据所述关联关系以及所述知识节点,生成所述法律知识图谱。
3.根据权利要求2所述的文件检索方法,其特征在于,所述基于标准法律文本对所述多个所述法律实体进行聚类操作,得到多个所述知识节点,包括:
在所述标准法律文本中确定各个所述法律实体的关联实体以及关联类型;
基于所述关联实体以及所述关联实体的所述关联类型,生成所述法律实体的关联网络;
若任意两个所述法律实体的所述关联网络之间的相似度大于预设的相似阈值,则识别所述两个法律实体存在别名关系;
将存在所述别名关系的多个所述法律实体聚类到同一所述知识节点。
4.根据权利要求1所述的文件检索方法,其特征在于,在所述基于预设的法律知识图谱内包含的知识节点,分别将各个所述历史案件划分为多个数据包之前,包括:
获取案件数据库中各个所述历史案件的案件标签,并基于各个所述案件标签的标签等级,构建所述案件数据库对应的案件关系树;所述案件关系树内包含有多个分支节点;每个分支节点关联一个所述案件标签;
根据所述案件标签,将各个所述历史案件导入到关联的所述分支节点,并基于所述分支节点内包含所有历史案件的法律实体,建立所述分支节点的法律子图谱;
根据所有分支节点的所述法律子图谱以及所述案件关系树,生成所述法律知识图谱。
5.根据权利要求1-4任一项所述的文件检索方法,其特征在于,所述基于预设的法律知识图谱内包含...
【专利技术属性】
技术研发人员:王喆龙,
申请(专利权)人:平安直通咨询有限公司上海分公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。