当前位置: 首页 > 专利查询>南京大学专利>正文

一种裁判文书说理评估方法技术

技术编号:20797246 阅读:35 留言:0更新日期:2019-04-06 10:51
本发明专利技术公开了一种基于计算相似度的裁判文书说理评估方法,主要步骤包括:切分法条前后件;使用XML解析技术提取出文书中的关键信息;构建法律专有停用词库,输入文本预处理等;将输入文本输入进模型中得到文本匹配结果;若是“法条与结论”的评估,使用“匹配关键字,比较量刑程度”的思路来判断逻辑是否一致;综合每一项评估主体的计算结果,将清晰简明的评估结果反馈给系统用户。本发明专利技术模拟法官检验裁判文书是否存在说理缺少关键环节、说理不充分、判决结果不合理的真实应用场景,每篇文书的评估速度约为8~10秒,速度较快,对于常见的9种刑事案件的评估准确率较高,能够满足真实应用场景下的使用要求。

A Method for Evaluating the Reasoning of Judgment Documents

The invention discloses a reasoning evaluation method for judgment documents based on calculating similarity. The main steps include: dividing the front and back parts of law articles; extracting key information from documents by using XML parsing technology; constructing a legal exclusive stop-use lexicon library, input text preprocessing, etc. input text into the model to obtain text matching results; if the evaluation of \law articles and conclusions\, using the method. The idea of \matching keywords and comparing sentencing degree\ is used to judge whether the logic is consistent or not. The clear and concise evaluation results are fed back to the users of the system by synthesizing the calculation results of each evaluation subject. The present invention simulates a real application scenario in which judges check whether there is a lack of key links in reasoning, inadequate reasoning and unreasonable judgment results. The evaluation speed of each document is about 8-10 seconds, and the speed is faster. The accuracy of the evaluation of nine common criminal cases is higher, and the application requirements of the real application scenario can be satisfied.

【技术实现步骤摘要】
一种裁判文书说理评估方法
本专利技术涉及一种裁判文书说理评估方法,具体涉及一种基于TensorFlowCNN的文本相似度方法,属于自然语言处理领域。
技术介绍
裁判文书是司法审判的最终产物,是当事人听得见、看得到的主要载体,也是法制宣传教育的生动教材。它所体现的,不仅仅有法官的个人素质,还有国家司法机构的形象。裁判文书的精髓是“说理”,说理部分将法官裁判的过程以书面化的形式呈现,不仅仅体现了法官的专业素质,还展现了国家司法机构对公平公正的解读。具有针对性、逻辑性、充分性的强有力说理,能够让人民群众感受到公平正义,对于服判息诉、定纷止争有着至关重要的作用。然而在现实生活中,由于种种原因,比如法官工作量巨大、力不从心,某些法官的责任意识淡薄,文书起草制度、文书评估制度、法官评价机制不尽合理等,时常有“简单粗暴”的文书面世。这些裁判文书的说理不充分甚至几乎没有说理,难免让人民群众对审判结果的合理性产生疑惑,让法院对司法权的行使显得蛮横、粗暴,影响司法公信力,对国家司法及司法机关的形象造成不好的影响。因此,规范化裁判文书的说理部分,使裁判文书达到“法”与“理”的有机统一,使判决结果合理化、公本文档来自技高网...

【技术保护点】
1.本专利公开了一种基于计算相似度的裁判文书说理评估方法,其特征在于包含以下步骤:步骤(1)根据提取出的法条前后件模式,进行法条前后件切分;步骤(2)解析裁判文书,提取文书关键信息;步骤(3)建立停用词典,对文本进行预处理;步骤(4)根据评估类型,计算某两种信息(事实与法条、结论与法条)之间的相似度;步骤(5)根据评估类型,综合文本相似度计算结果,得到无对应内容的元素;步骤(6)根据评估类型,输出评估结果。

【技术特征摘要】
1.本专利公开了一种基于计算相似度的裁判文书说理评估方法,其特征在于包含以下步骤:步骤(1)根据提取出的法条前后件模式,进行法条前后件切分;步骤(2)解析裁判文书,提取文书关键信息;步骤(3)建立停用词典,对文本进行预处理;步骤(4)根据评估类型,计算某两种信息(事实与法条、结论与法条)之间的相似度;步骤(5)根据评估类型,综合文本相似度计算结果,得到无对应内容的元素;步骤(6)根据评估类型,输出评估结果。2.根据权利要求1所述的一种基于计算相似度的裁判文书说理评估方法,其特征在于步骤(1)中根据从大量法律法规文件中提取出来的法条前后件模式,对常用的刑法和民法的法律法规文件中的条款进行法条前后件切分。3.根据权利要求1所述的一种基于计算相似度的裁判文书说理评估方法,其特征在于步骤(2)中提取裁判文书的关键信息,比如案件的基本信息、裁判说理的案件事实、引用法条、判决结论。具体子步骤包括:步骤(2.1)使用XML解析从裁判文书中抽取出文首、诉讼记录、分析过程、判决结果、文尾、引用法律等节点;步骤(2.2)从文首节点中提取出案件案号、案件类型等信息,从诉讼记录节点中提取出案件当事人、指控罪名、案件案由、认定事实、指控段落等信息,从文尾节点中提取出裁判时间、审判人员等信息,从引用法律节点提取出引用法条等信息。4.根据权利要求1所述的一种基于计算相似度的裁判文书说理评估方法,其特征在于步骤(3)中建立停用词典,对文本进行预处理。具体子步骤包括:步骤(3.1)先构建中文常用的停用词库:包括标点符号、序列编号、语气词、语义连词等;再构建法律专用停用词库:计算在某一特定案由下所有文档中出现的每个词语的词频,计算它们的类别信息熵,按照文档频次和类别信息熵进行降序排序,筛选出文档频次大于某一阈值,类别信息熵大于某一阈值的词作为停用词库;步骤(3.2)对得到的案件事实、引用法条、判决结论信息,使用“;”和“。”进行切割,得到对应的案件事实集合F={f1,f2,...,fn}、引用法条集合L={l1,l2,...,ln}、判决结论集合J={j1,j2,...,jn}。对于每一个fi、li、ji,进行中文分词,筛选出词性为名词n、动词v和形容词a的词语,将其转化成由词语组成的列表;步骤(3.3)对于得到的词语列表,使用已经构建的通用中文停用词库和法律专用停用词库对其进行去停用词处理。5.根据权利要求1所述的一种基于计算相似度的裁判文书说理评估方法,其特征在于步骤(4)中根据评估类型,计算某两种信息(事实与法条、结论与法条)之间的相似度。若评估类型为引用法条和判决结论之间的评估,还需要...

【专利技术属性】
技术研发人员:葛季栋李传艺李中月魏彦淑冯奕孔力周筱羽骆斌
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1