一种文件检索的方法及设备技术

技术编号:26890658 阅读:19 留言:0更新日期:2020-12-29 16:07
本申请适用于人工智能技术领域,提供了一种文件检索的方法及设备,包括:接收检索请求;所述检索请求包含目标文本以及检索类型;基于预设的法律知识图谱,生成关于所述目标文本的文本向量;选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。本申请通过法律知识图谱对目标文本进行语义分析,提取对应的文本向量,用户可以通过自然语言描述所需搜索的问题,而无需思考对应的关键词,从而能够降低了检索问题的描述难度。

【技术实现步骤摘要】
一种文件检索的方法及设备
本申请属于人工智能
,尤其涉及一种文件检索的方法及设备。
技术介绍
随着法律知识的普及,广大民众与法律案件接触机会越来越多,因工作需要或个人兴趣等原因,用户可以选取特定的案件进行查阅。但由于法律案件数量众多,若需要用户进行手动筛选案件,则会大大增加了用户选取案件所需时长,从而增加了案件选取的难度。因此,如何提供高效的法律案件的检索手段则成为当前急需解决的问题。现有的法律案件的检索技术,主要采用基于关键词进行搜索,判断文本中是否存在用户输入的关键词,但由于用户法律知识受限,往往无法准确表达所需检索的关键词,因此通过关键词搜索往往会增加检索难度,并且不同关键词在检索过程中相互独立,检索结果内往往会出现大量与检索请求之间关联度较低的法律文件,从而降低了搜索效率。
技术实现思路
有鉴于此,本申请实施例提供了一种文件检索的方法及设备,以解决现有的文件检索技术,主要采用基于关键词进行搜索,增加了检索难度以及降低了搜索效率的问题。本申请实施例的第一方面提供了一种文件检索的方法,包括:接收检索请求;所述检索请求包含目标文本以及检索类型;基于预设的法律知识图谱,生成关于所述目标文本的文本向量;选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。本申请实施例的第二方面提供了一种文件检索的装置,包括:检索请求接收单元,用于接收检索请求;所述检索请求包含目标文本以及检索类型;文本向量生成单元,用于基于预设的法律知识图谱,生成关于所述目标文本的文本向量;检索语段生成单元,用于选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;检索结果输出单元,用于从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。实施本申请实施例提供的一种文件检索的方法及设备具有以下有益效果:本申请实施例在接收到用户发起的检索请求后,可以将检索请求内包含的目标文本导入到预先建立的法律知识图谱内,得到与目标文本相关联的文本向量,并基于检索类型确定关联的检索模型,将文本向量导入到检索模型内,生成对应的检索语段,通过检索语段确定检索请求对应的目标法律文件,生成检索结果,实现了文件精准检索的目的。与现有的文件检索技术相比,本申请通过法律知识图谱对目标文本进行语义分析,提取对应的文本向量,用户可以通过自然语言描述所需搜索的问题,而无需思考对应的关键词,从而能够降低了检索问题的描述难度;另一方面,根据不同的检索类型配置对应的检索模型,从而使得检索语段更为准确,大大降低了低相关度文件的数量,从而提高了检索效率,实现了精准检索的目的。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请第一实施例提供的一种文件检索的方法的实现流程图;图2是本申请第二实施例提供的一种文件检索的方法S102具体实现流程图;图3是本申请第三实施例提供的一种文件检索的方法具体实现流程图;图4是本申请一实施例提供的法律知识图谱的示意图;图5是本申请第四实施例提供的一种文件检索的方法S302具体实现流程图;图6是本申请第五实施例提供的一种文件检索的方法S103具体实现流程图;图7是本申请第六实施例提供的一种文件检索的方法S103具体实现流程图;图8是本申请第七实施例提供的一种文件检索的方法S104具体实现流程图;图9是本申请一实施例提供的一种文件检索的设备的结构框图;图10是本申请另一实施例提供的一种终端设备的示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例在接收到用户发起的检索请求后,可以将检索请求内包含的目标文本导入到预先建立的法律知识图谱内,得到与目标文本相关联的文本向量,并基于检索类型确定关联的检索模型,将文本向量导入到检索模型内,生成对应的检索语段,通过检索语段确定检索请求对应的目标法律文件,生成检索结果,实现了文件精准检索的目的,解决了现有的法律案件的检索技术,主要采用基于关键词进行搜索,判断文本中是否存在用户输入的关键词,但由于用户法律知识受限,往往无法准确表达所需检索的关键词,因此通过关键词搜索往往会增加检索难度,并且不同关键词在检索过程中相互独立,检索结果内往往会出现大量与检索请求之间关联度较低的法律文件,从而降低了搜索效率的问题。在本申请实施例中,流程的执行主体为终端设备。该终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等能够执行文件检索的任务的设备。图1示出了本申请第一实施例提供的文件检索的方法的实现流程图,详述如下:在S101中,接收检索请求;所述检索请求包含目标文本以及检索类型。在本实施例中,终端设备可以接收用户发起的检索请求。用户在需要对法律文件进行检索时,可以通过本地的用户终端生成一个检索请求,并将检索请求发送给终端设备,终端设备对上述检索请求予以相应。在一种可能的实现方式中,该终端设备具体为一文件数据库服务器,该文件数据库服务器存储有多个法律文件,数据库服务器可以根据用户发起的检索请求,将文件数据库内与检索请求关联的法律文件,生成一检索结果,并反馈给用户终端,以响应用户的查询以及检索请求。在该情况下,用户终端可以安装有与数据库服务器对应的客户端程序,该客户端程序可以在用户终端上生成检索页面,用户可以在检索页面内输入与检索请求相关的信息,并通过点击检索页面上的控件,例如“发起检索”、“开始检索”等按键,生成检索请求,客户端程序可以将上述生成的检索请求发送给文件数据库服务器,以激活检索流程。在一种可能的实现方式中,各个向终端设备发起检索请求的用户终端以及提供检索服务的终端设备可以构成一区块链系统,即各个用户终端以及终端设备均作为上述区块链系统的区块节点。上述检索请求可存储于区块链节点中,采用区块链网络对生成的检索请求记录进行存储,使得记录信息不易被篡改。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区本文档来自技高网...

【技术保护点】
1.一种文件检索的方法,其特征在于,包括:/n接收检索请求;所述检索请求包含目标文本以及检索类型;/n基于预设的法律知识图谱,生成关于所述目标文本的文本向量;/n选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;/n从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。/n

【技术特征摘要】
1.一种文件检索的方法,其特征在于,包括:
接收检索请求;所述检索请求包含目标文本以及检索类型;
基于预设的法律知识图谱,生成关于所述目标文本的文本向量;
选取与所述检索类型关联的检索模型,并基于所述检索模型以及所述文本向量,生成所述检索请求关联的检索语段;
从文件数据库中选取与所述检索语段匹配的目标法律文件,生成检索结果。


2.根据权利要求1所述的方法,其特征在于,所述基于预设的法律知识图谱,生成关于所述目标文本的文本向量,包括:
获取预设的划分粒度信息;所述划分粒度信息包含N个划分层级;所述N为不小于1的正整数;
基于第n个划分层级,将所述目标文本划分为多个n类信息段,并基于所述法律知识图谱,各个确定所述n类信息段对应的文本标签;所述n的初始值为1;
若所述n小于所述N,则将所述n类信息段识别为目标文本,并增加所述n的值,返回执行所述基于第n个划分层级,将所述目标文本划分为多个n类信息段,并基于所述法律知识图谱,各个确定所述n类信息段对应的文本标签;
若所述n大于或等于所述N,则基于所有文本标签,生成所述文本向量。


3.根据权利要求1所述的方法,其特征在于,在所述基于预设的法律知识图谱,生成关于所述目标文本的文本向量之前,还包括:
获取用于构建所述法律知识图谱的法律知识标签;
基于所述文件数据库内的所有已有法律文件,确定所述法律知识标签之间的关联关系以及所述关联关系对应的关联类型;所述关联类型用于表示所述关联关系的适用场景;
基于同一所述关联类型的所有所述法律知识标签之间的所述关联关系,构建所述关联类型的知识子图谱;
提取各个标准法律文本的核心法律标签,并在各个所述关联类型对应的所述知识子图谱内标记与所述核心法律标签匹配的关联知识标签;
根据属于同一所述核心法律标签的各个所述关联知识标签,建立多个所述关联类型的所述知识子图谱之间的关联关系,生成所述法律知识图谱;属于同一所述核心法律标签的各个所述关联知识标签对应的法律实体相同。


4.根据权利要求3所述的方法,其特征在于,所述基于所述文件数据库内的所有已有法律文件,确定所述法律知识标签之间的关联关系以及所述关联关系对应的关联类型,包括:
对已有法律文件进行语义分析,确定所述已有法律文件对应的文本类型;
若所述已有法律文本的任一语段内包含多个所述法律知识标签,则基于所述已有法律文本的所述语段中的其他字符,确定所述多个法律知识标签之间的关联关系;所述其他字符为在所述已...

【专利技术属性】
技术研发人员:朱弘煜
申请(专利权)人:平安直通咨询有限公司上海分公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1