一种案件法律条例推荐方法及系统技术方案

技术编号:17516503 阅读:44 留言:0更新日期:2018-03-21 01:06
一种案件法律条例推荐方法,包括步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并向量化基础上将的结构化信息和非结构化信息共同编码形成裁判文书向量;步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别,以及这个类别中应用的法律条例;步骤5,预测案件的犯罪类型得到法律条文的相关度矩阵,并且计算相似案例应用的法律条例置信度,最后基于犯罪类型及相似案件给出案件应用的法律条文推荐组合。

A method and system for the recommendation of legal regulations in the case

A case law recommendation method, which comprises the steps: 1, obtain judgment information and the basic rule of laws and regulations of information processing of sensitive information and judgment involved; step 2, will get the referee instruments preprocessto obtain information structured and unstructured information; step 3, the structured information to to quantify the unstructured information clause segmentation vectorization, and form a judgment vector to structured and unstructured information on the basis of the common encoding quantization; step 4, detailed categories will be input to the judgment vector prediction model and obtain the corresponding type of criminal cases, and the application of this category of laws and regulations; step 5, correlation matrix type of crime cases obtained the legal provisions of the laws and regulations, and calculate the similar case the application of confidence, based on Crime The type of crime and similar cases give a combination of legal provisions for the application of the case.

【技术实现步骤摘要】
一种案件法律条例推荐方法及系统
本专利技术属于司法领域和自然语言处理领域,涉及一种案件法律条例推荐方法及系统。
技术介绍
世界信息化快速发展,互联网、大数据渗透到生活的各个角落,司法领域信息化受到广泛关注,“互联网+法治”的大数据法制时代已经悄然来临。随着国民素质的提高,人民群众的法律意识越来越强,司法需求日趋多元,我国积极推动司法信息化发展,近年来各级法院信息化建设蓬勃发展,信息化与各项业务工作的良性互动格局基本形成,借助网上办案平台,立案网络化、裁判文书公开化、审判流程可视化等司法举措已落地有声。2013年7月1日,中国裁判文书网上线,生效裁判文书开始在互联网公布,到2017年8月中国裁判文书网累计公开裁判文书超过3247万篇,总访问量突破100亿次,日均访问量达1729万人次,单日最高访问量高达5000万人次。其中超过17.5亿的访问量来自海外,访问范围覆盖全球210多个国家和地区。中国裁判文书网已成为全球最大的裁判文书公开平台。案件数量的不断增长,给法律服务带来巨大压力。但是,司法领域需要很强的专业性,我国适用的法律条例众多,专业律师也很难涉猎所有的法律条款,并且案件种类繁多,从海量的法律条款中找到恰当的支持本案件的法律条款耗时耗力。因此,如何借助人工智能推进司法信息化,提高办案人员工作效率保障人民群众的司法需求是亟待解决的问题。目前,有很多法律条款的辅助查询工具,但是根据案件基本情况推荐适用的法律的资料较少,专利CN201410356389.3是存储法律问题及法律对应的解决方案等生成法律知识模型库,根据查询语句从法律知识模型库中查找匹配的法律问题,从而给出对应的法律条款生成可编辑法律文书;专利CN201510528314.3公开了一种用于法律咨询服务的智能法律知识库及其查询系统,输入法律需求可获得对应的法律条例;专利CN201510869254.1通过获取查询文本的关键词,并用含义相同或者相近的法律词来进行关键词扩充,从而获取与查询相关的裁判文书,生成对应的法律条文。首先,大部分法律条文查询系统基于创建的法律条文知识库,查询结果受限于知识库的规模和准确性,某些法律条文可能不适合同时应用,并且不能根据输入的案件信息进行智能推荐;其次,针对某个法律问题,当事人不同或者犯罪情节及过程等有差别,会影响查询结果;并且,一个案件情况可能涉及多种法律问题,查询单个问题不是最好的查询方式。
技术实现思路
本专利技术提出了一种推荐准确性高、可扩展的案件法律条例推荐方法及系统。本专利技术采用的技术方案是:一种案件法律条例推荐方法,其特征在于:包括步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并在向量化的基础上将结构化信息和非结构化信息共同编码形成裁判文书向量;步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别C,以及这个类别中应用的法律条例tL;步骤5,待检索的裁判文书的推荐法律条文输出,包括(1)将待检索的裁判文书经步骤1和步骤2进行向量化得到的搜索案件向量,并计算与步骤3中训练数据相似的裁判文书,进行相似案例的法律条例置信度计算,并提取置信度排名靠前s′的相似案例对应的法律条例sLAW={sL1,sL2,...,sLs′};(2)根据案件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],并通过应用次数nL构建法律条例相关度矩阵M;(3)将sLAW中的每条法律条例与tLAW中的法律条例相对应,从法律条例相关度矩阵M中获取对应上的法律条例的相关系数,并根据相关系数的相关度输出推荐的法律条例,并且将推荐的多组法律条例进行排序输出。进一步,结构化信息包括性别,年龄,职业,身体状况,案发地,犯罪类型,法律条例,非结构化信息包括案情信息。进一步,步骤3中通过词编码模型与句编码模型对结构化信息和非结构化信息进行向量化,具体包括:词编码模型2对结构化信息进行编码,输出维度为dim2的词向量;词编码模型1对非结构化信息分局分词后的单词进行编码,输出维度为dim1的词向量;句编码模型1是将经过词编码模型1词编码后的单词再进行编码,输出维度为dim2的句向量;句编码模型2是将句编码模型1编码后的句向量和词编码模型2编码后的词向量进一步编码为裁判文书向量。进一步,步骤5的(1)中置信度计算步骤包括:搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过夹角余弦的形式如公式(1),经过降序排序,获取前s个最相似案例,s取值要适中,分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置信度,某个案件适用法律条例j的置信度如公式(2)其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排序,值越大则置信度越高。进一步,步骤5的(1)中进一步,步骤5的(2)中t的选取可按照公式(3)计算,通过应用次数构建法律条例相关度矩阵M,如公式(4)其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL))是处理整个类别中应用的法律条例不是特别多的情况;Th是一个常数阈值;mij是t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同时出现第i,j条法律条例的案件个数;分母是时出现第i,j条法律条例并且j从1到t的和,mij∈[0,1]值越大相关性越高,根据相关性组合输出推荐的法律条例。进一步,步骤5的(3)中推荐的法律条例的输出具体步骤包括:将sLAW中的每条法律条例与tLAW中的法律条例相对应,当sLAW中的某条法律sLp与tLAW中法律条例tLq相对应,则取的关度矩阵M中的q行mqj,j={1,2,...,t}并进行排序,取前t′个mqj,j={1,2,...,t}对应的条法律条例GLp={sLp,l1,l2,...,lt′},构成一组法律推荐输出,GLp中至少包一条sLAW中的法律条例,l是与tLq相关度高的前t′个法律条例;当sLAW所有的法律条例均能与tLAW中的法律条例对应上,则sLAW共有s′条置信度高的法律条例,则根据相关度矩阵共有s′组法律推荐输出,将sLAW与tLAW中无法对应的法律条例丢弃,如果sLAW中所有的法律条例均无法对应到tLAW,则推荐失败;对推荐的法律条例组GL进行排序输出,当每组法律条例中包含LAW中法律条例多,则优先输出;当包含的sLAW中法律条例个数相同,则总置信度高的法律条例组优先输出。一种案件法律条例推荐系统,其特征在于:包括依次连接的数据输入模块、文书预处理模块、法律推荐预处理模块、法律推荐模块、输出模块;数据输入模块,用于输入待查查询的案件;文书预处理本文档来自技高网
...
一种案件法律条例推荐方法及系统

【技术保护点】
一种案件法律条例推荐方法,其特征在于:包括步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并在向量化基础上将结构化信息和非结构化信息共同编码形成裁判文书向量;步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别C,以及这个类别中应用的法律条例tL;步骤5,待检索的裁判文书的推荐法律条文输出,包括(1)将待检索的裁判文书经步骤1和步骤2进行向量化得到的搜索案件向量,并计算与步骤3中训练数据相似的裁判文书,进行相似案例的法律条例置信度计算,并提取置信度排名靠前s′的相似案例对应的法律条例sLAW={sL1,sL2,...,sLs′};(2)根据案件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],并通过应用次数nL构建法律条例相关度矩阵M;(3)将sLAW中的每条法律条例与tLAW中的法律条例相对应,从法律条例相关度矩阵M中获取对应上的法律条例的相关系数,并根据相关系数的相关度输出推荐的法律条例,并且将推荐的多组法律条例进行排序输出。...

【技术特征摘要】
1.一种案件法律条例推荐方法,其特征在于:包括步骤1,获取裁判文书信息和基本的判案法律条例信息,并对裁判文书涉及到的敏感信息进行处理;步骤2,将获取的裁判文书进行预处理得到结构化信息和非结构化信息;步骤3,将结构化信息向量化,非结构化信息分句分词后向量化,并在向量化基础上将结构化信息和非结构化信息共同编码形成裁判文书向量;步骤4,将裁判文书向量输入到犯罪类型预测模型获取相应案件的详细类别C,以及这个类别中应用的法律条例tL;步骤5,待检索的裁判文书的推荐法律条文输出,包括(1)将待检索的裁判文书经步骤1和步骤2进行向量化得到的搜索案件向量,并计算与步骤3中训练数据相似的裁判文书,进行相似案例的法律条例置信度计算,并提取置信度排名靠前s′的相似案例对应的法律条例sLAW={sL1,sL2,...,sLs′};(2)根据案件犯罪类型获取应用多的法律条例,统计犯罪类型对应的法律条例tL和每条法律条例对应的应用次数nL,按照nL降序排序,取类别中应用较多的t条法律条例,则由犯罪类型获得相关的法律推荐tLAW=[tL1,tL2,…,tLt],并通过应用次数nL构建法律条例相关度矩阵M;(3)将sLAW中的每条法律条例与tLAW中的法律条例相对应,从法律条例相关度矩阵M中获取对应上的法律条例的相关系数,并根据相关系数的相关度输出推荐的法律条例,并且将推荐的多组法律条例进行排序输出。2.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:结构化信息包括性别,年龄,职业,身体状况,案发地,犯罪类型,法律条例,非结构化信息包括案情信息。3.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤3中通过词编码模型与句编码模型对结构化信息和非结构化信息进行向量化,具体包括:词编码模型2对结构化信息进行编码,输出维度为dim2的词向量;词编码模型1对非结构化信息分局分词后的单词进行编码,输出维度为dim1的词向量;句编码模型1是将经过词编码模型1词编码后的单词再进行编码,输出维度为dim2的句向量;句编码模型2是将句编码模型1编码后的句向量和词编码模型2编码后的词向量进一步编码为裁判文书向量。4.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤5的(1)中置信度计算步骤包括:搜索案件向量Vdoc和某个训练数据的裁判文书向量doci通过夹角余弦的形式如公式(1),经过降序排序,获取前s个最相似案例,s取值要适中,分别统计s个相似案例中应用了哪些法律条例,分别计算这些法律条例的置信度,某个案件适用法律条例j的置信度如公式(2)其中,sLj是案件适用法律i的置信度,num(j)是s个相似案例中使用法律j的案件数量,s是总的相似案例数量,sLj的值在0到1之间,对sLj进行降序排序,值越大则置信度越高。5.根据权利要求4所述的一种案件法律条例推荐方法,其特征在于:步骤5的(1)中6.根据权利要求1所述的一种案件法律条例推荐方法,其特征在于:步骤5的(2)中t的选取可按照公式(3)计算,通过应用次数构建法律条例相关度矩阵M,如公式(4)其中,num(·)是取个数的函数,表示取满足条件的个数,max()是取最大值函数,α是一个系数在0到1之间,表示占最大值的百分比,num(nL>αmax(nL))是处理整个类别中应用的法律条例不是特别多的情况;Th是一个常数阈值;mij是t条法律中第i,j条法律条例的相关系数,且i,j∈[1,t],计算如公式(5)其中∩表示同时出现法律条例i,j,num(·)是取个数的函数,则分子表示同时出现...

【专利技术属性】
技术研发人员:王开红李建元陈涛张云云涂昶
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1