基于知识图谱的法律条文精准搜索排序方法技术

技术编号:19009246 阅读:47 留言:0更新日期:2018-09-22 09:06
本发明专利技术公开了一种基于知识图谱的法律条文精准搜索排序方法,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值;S104、获取主题词库的子集组合,依次形成元素个数为m,m‑1,m‑2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。

Precise search and ranking method for legal provisions based on Knowledge Map

The invention discloses a method for precise searching and sorting of legal provisions based on knowledge map, which comprises the following steps: S101, input keywords to be searched; S102, obtain the subject words matching the keywords to be searched and the Related words of the subject words from the legal knowledge map model to form a subject word bank; S103, and know the subject words according to the law; Recognizing the relationship between the core themes in the atlas model, dynamically generate the weight of the keywords and their associations in the thesaurus of the same case; S104, get the subset combination of the thesaurus, and form the number of elements m, m_1, m_2... Subset combinations of 2; S105; one keyword from each subset combination to form the final keyword combination for search; S106; ranking all subset combinations based on the number of keyword combinations ultimately used for search and the total weight of keywords; S107; using the selected keyword combinations after sorting in France Search is made in the database, and the search results are sorted and displayed.

【技术实现步骤摘要】
基于知识图谱的法律条文精准搜索排序方法
本专利技术涉及法律条文搜索排序方法,具体涉及一种基于知识图谱的法律条文精准检索和搜索结果优先排序方法。
技术介绍
加强法制中国建设,推进依法治国基本方略尤为重要,依法行政是依法治国的重要环节。在各司法案中,所有案件都必须依法判决,司法人员除依靠自身业务知识和经验外,经常需要检索待办案件中涉及到的法律条文,精准、高效的进行法律条文的检索成了司法工作人员其他法律条文搜索人员的迫切需求。随着人工智能的普及和高效运作,知识图谱作为一种人工智能的基础知识表示方法被引入了法律条文检索领域。知识图谱(KnowledgeGraph)描述了客观世界的概念、实体、事件及其之间的关系,使用知识图谱描述法律条文,使各门类的法条概念串联起来,概念关系更加清晰,在此基础上的对于法律条文的检索更加精准、高效。由于现有的法律条文检索排序方法是基于关键字匹配程度基础上实现的,因此如果将不是法律条文中的法律概念作为关键字进行检索,就可能导致司法人员在工作中无法获得理想的法律条文搜索排序结果,或者需要反复更改关键字并且反复调整关键字的组合方式才能搜索到可用的法律条文结果。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术在法律条文的检索中通过不是法律概念进行检索无法获得理想的法律条文检索结果的缺陷,提供一种基于知识图谱的法律条文精准搜索排序方法。本专利技术解决其技术问题所采用的技术方案是:提供一种基于知识图谱的法律条文精准搜索排序方法,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0,1);S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m-1,m-2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。接上述技术方案,根据在法律条文数据库中的搜索结果,在权值范围内调整关联词的权值。接上述技术方案,步骤S107中,搜索时,记录主题词组合中的每一个主题词在法律条文文档中对应的位置及出现主题词的次数,按照法律条文文档中出现主题词的次数对法律条文进行排序,出现次数最多的法律条文排在搜索结果在最前面呈现。接上述技术方案,所述法律知识图谱模型根据对所构建法律知识图谱的文件进行解析和转换而生成,该法律知识图谱模型对同一案由相关案件的主题词按照三个主要方面进行组织,对每个方面再进行分类,在每个分类中对其涉及的主题进行代表范围的分析,定义主题之间的上、下位或同位关系;三个主要方面包括主体、权利义务和客体、法律事实。接上述技术方案,匹配到的主题词权值为1.0,其上位主题、下位主题以及上下位主题的标签同义词的权值为0.5。接上述技术方案,匹配到的主题词权值为1.0,其第n层上位主题、第n层下位主题、第n层上下位主题的标签同义词的权值为0.5n,其中n为自然数。本专利技术还提供一种基于知识图谱的法律条文精准搜索排序系统,包括:输入模块,用于输入待搜索关键词;主题词库生成模块,用于从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0,1];权值生成模块,用于根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;子集组合生成模块,用于获取主题词库的子集组合,依次形成个数为m,m-1,m-2…2的子集组合;从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;搜索结果显示模块,用于使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。本专利技术还提供了一种计算机可读存储介质,包括可被处理器执行的计算机程序,该计算机程序具体执行如权利要求1-5中任一项所述的基于知识图谱的法律条文精准搜索排序方法。本专利技术产生的有益效果是:本专利技术采用法律知识图谱描述法律主题词之间的逻辑关系、主题词与其他表述词汇之间的逻辑关系,通过对于法律知识图谱的解析和分析获取待搜索关键词的主题词库,对于主题词库中的主题词和关联词进行权值设置,通过组合权值的高低作为优先搜索的依据对搜索结果进行排序。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术实施例一的基于知识图谱的法律条文精准搜索排序方法的流程图;图2是本专利技术实施例二的基于知识图谱的法律条文精准搜索排序方法的流程图;图3是关于财产权的法律知识图谱。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,本专利技术实施例一中基于知识图谱的法律条文精准搜索排序方法主要包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0,1];S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m-1,m-2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。进一步地,根据在法律条文数据库中的搜索结果,可根据实际情形在权值范围内调整关联词的权值。步骤S107中,搜索时,记录主题词组合中的每一个主题词在法律条文文档中对应的位置及出现主题词的次数,按照法律条文文档中出现主题词的次数对法律条文进行排序,出现次数最多的法律条文排在搜索结果在最前面呈现。所述法律知识图谱模型根据对所构建法律知识图谱的文件进行解析和转换而生成,该法律知识图谱本文档来自技高网...
基于知识图谱的法律条文精准搜索排序方法

【技术保护点】
1.一种基于知识图谱的法律条文精准搜索排序方法,其特征在于,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0‑1];S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m‑1,m‑2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。

【技术特征摘要】
1.一种基于知识图谱的法律条文精准搜索排序方法,其特征在于,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0-1];S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m-1,m-2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。2.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,根据在法律条文数据库中的搜索结果,根据实际情形在权值范围内调整关联词的权值。3.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,步骤S107中,搜索时,记录主题词组合中的每一个主题词在法律条文文档中对应的位置及出现主题词的次数,按照法律条文文档中出现主题词的次数对法律条文进行排序,出现次数最多的法律条文排在搜索结果在最前面呈现。4.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,所述法律知识图谱模型根据对所构建法律知识图谱的文件进行解析和转换而生成,该法律知识图谱模型对同一案由相关案件的主题词按照三个主要方面进行组织,对每个方面再进行分类,在...

【专利技术属性】
技术研发人员:刘玮顾全李岳郭竞知万谦李晓林
申请(专利权)人:武汉工程大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1