The invention discloses a method for precise searching and sorting of legal provisions based on knowledge map, which comprises the following steps: S101, input keywords to be searched; S102, obtain the subject words matching the keywords to be searched and the Related words of the subject words from the legal knowledge map model to form a subject word bank; S103, and know the subject words according to the law; Recognizing the relationship between the core themes in the atlas model, dynamically generate the weight of the keywords and their associations in the thesaurus of the same case; S104, get the subset combination of the thesaurus, and form the number of elements m, m_1, m_2... Subset combinations of 2; S105; one keyword from each subset combination to form the final keyword combination for search; S106; ranking all subset combinations based on the number of keyword combinations ultimately used for search and the total weight of keywords; S107; using the selected keyword combinations after sorting in France Search is made in the database, and the search results are sorted and displayed.
【技术实现步骤摘要】
基于知识图谱的法律条文精准搜索排序方法
本专利技术涉及法律条文搜索排序方法,具体涉及一种基于知识图谱的法律条文精准检索和搜索结果优先排序方法。
技术介绍
加强法制中国建设,推进依法治国基本方略尤为重要,依法行政是依法治国的重要环节。在各司法案中,所有案件都必须依法判决,司法人员除依靠自身业务知识和经验外,经常需要检索待办案件中涉及到的法律条文,精准、高效的进行法律条文的检索成了司法工作人员其他法律条文搜索人员的迫切需求。随着人工智能的普及和高效运作,知识图谱作为一种人工智能的基础知识表示方法被引入了法律条文检索领域。知识图谱(KnowledgeGraph)描述了客观世界的概念、实体、事件及其之间的关系,使用知识图谱描述法律条文,使各门类的法条概念串联起来,概念关系更加清晰,在此基础上的对于法律条文的检索更加精准、高效。由于现有的法律条文检索排序方法是基于关键字匹配程度基础上实现的,因此如果将不是法律条文中的法律概念作为关键字进行检索,就可能导致司法人员在工作中无法获得理想的法律条文搜索排序结果,或者需要反复更改关键字并且反复调整关键字的组合方式才能搜索到可用的法律条文结果。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术在法律条文的检索中通过不是法律概念进行检索无法获得理想的法律条文检索结果的缺陷,提供一种基于知识图谱的法律条文精准搜索排序方法。本专利技术解决其技术问题所采用的技术方案是:提供一种基于知识图谱的法律条文精准搜索排序方法,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关 ...
【技术保护点】
1.一种基于知识图谱的法律条文精准搜索排序方法,其特征在于,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0‑1];S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m‑1,m‑2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。
【技术特征摘要】
1.一种基于知识图谱的法律条文精准搜索排序方法,其特征在于,包括以下步骤:S101、输入待搜索关键词;S102、从法律知识图谱模型中获取与待搜索关键词匹配的主题词及该主题词的关联词,形成主题词库;关联词包括:上位主题、下位主题及标签同义词;其中,上位主题是指所代表的范围大的主题,下位主题是指所代表的范围小的主题,标签同义词为在标签中定义的代表范围相似的主题;主题词属性包括:主题词名称和主题词权值,权值范围为(0-1];S103、根据与法律知识图谱模型中核心主题的关联关系,动态生成同一案由的主题词库中的主题词及其关联词的权值,权值越高说明与核心主题代表的范围越接近;S104、获取主题词库的子集组合,依次形成个数为m,m-1,m-2…2的子集组合;S105、从每个子集组合中各取出一个主题词形成最终用于搜索的主题词组合;S106、以最终用于搜索的主题词组合中的个数和关键词总权重为依据对所有的子集组合进行排序;S107、使用排序后选择的主题词组合在法律条文数据库中进行搜索,并对搜索结果进行排序显示。2.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,根据在法律条文数据库中的搜索结果,根据实际情形在权值范围内调整关联词的权值。3.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,步骤S107中,搜索时,记录主题词组合中的每一个主题词在法律条文文档中对应的位置及出现主题词的次数,按照法律条文文档中出现主题词的次数对法律条文进行排序,出现次数最多的法律条文排在搜索结果在最前面呈现。4.根据权利要求1所述的基于知识图谱的法律条文精准搜索排序方法,其特征在于,所述法律知识图谱模型根据对所构建法律知识图谱的文件进行解析和转换而生成,该法律知识图谱模型对同一案由相关案件的主题词按照三个主要方面进行组织,对每个方面再进行分类,在...
【专利技术属性】
技术研发人员:刘玮,顾全,李岳,郭竞知,万谦,李晓林,
申请(专利权)人:武汉工程大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。