一种基于裁判文书的论辩观点挖掘方法及系统技术方案

技术编号:28053502 阅读:79 留言:0更新日期:2021-04-14 13:19
本发明专利技术公开了一种基于裁判文书的论辩观点挖掘方法及系统,本发明专利技术的方法包括:分段裁判文书,得到原告诉称的段落内容和被告辩称的段落内容;分别将原告诉称的段落内容和被告辩称的段落内容分句;一一匹配原告诉称的分句内容与被告辩称的分句内容,判断原告诉称和被告辩称的两个分句内容是否能够组成辩论对。本发明专利技术借助计算机技术以及自然语言处理技术自动识别提取裁判文书中的争议焦点,利用机器学习算法提取裁判文书中的辩论对。算法提取裁判文书中的辩论对。算法提取裁判文书中的辩论对。

【技术实现步骤摘要】
一种基于裁判文书的论辩观点挖掘方法及系统


[0001]本专利技术属于自然语言处理
,具体涉及一种基于裁判文书的论辩观点挖掘方法及系统。

技术介绍

[0002]随着新诉讼制度的逐步形成,中国法院围绕有争议的问题组织辩论。有争议的问题是双方冲突的核心。而找出围绕原告和被告对有争议问题展开的辩论对,能够更加清晰明了的找出问题的核心所在。这些论辩对有助于在法庭审判中集中事实调查,而法律争议性问题有助于法庭辩论组织和法律适用。判决书体现了法律论证的过程,判决书中所包含的争议问题在庭审过程中被整理、调查和辩论。因此,针对有争议性问题的双方论辩在审判现场的恢复和法官的决策中起着关键的作用。
[0003]到目前为止,网上公布的判决数量超过了8000万。然而,有效地识别海量数据中的关键信息将是一个巨大的挑战。同时在数量有限的情况下,由于访问权限的限制,法官很难利用其他法官的经验总结争议性问题并进行试验,这极大地阻碍了经验的传播和法律知识的积累。然而,由于语料库庞大、表达式多样、门类繁多,人为识别提取论辩对效率低,且成本高。/>
技术实现思路
...

【技术保护点】

【技术特征摘要】
1.一种基于裁判文书的论辩观点挖掘方法,其特征在于,该方法包括以下步骤:分段裁判文书,得到原告诉称的段落内容和被告辩称的段落内容;分别将原告诉称的段落内容和被告辩称的段落内容分句;一一匹配原告诉称的分句内容与被告辩称的分句内容,判断原告诉称和被告辩称的两个分句内容是否能够组成辩论对。2.根据权利要求1所述的一种基于裁判文书的论辩观点挖掘方法,其特征在于,所述对裁判文书进行分段的步骤具体为:通过裁判文书结构化的方法分段裁判文书。3.根据权利要求1所述的一种基于裁判文书的论辩观点挖掘方法,其特征在于,所述分别将原告诉称的段落内容和被告辩称的段落内容分句的步骤具体包括:对段落内容进行基础分句;采用Bert模型对相邻两个基础分句进行二分类,确定两个基础分句是否在对同一个问题进行辩论。4.根据权利要求1所述的一种基于裁判文书的论辩观点挖掘方法,其特征在于,所述一一匹配原告诉称的分句内容与被告辩称的分句内容,判断原告诉称和被告辩称的两个分句内容是否能够组成辩论对的步骤具体为:采用Bert模型对一一匹配的原告诉称的分句内容与被告辩称的分句进行二分类,确定两个分句是否在对同一问题进行辩论。5.根据权利要求3或4所述的一种基于裁判文书的论辩观点挖掘方法,其特征在于,所述Bert模型训练过程包括以下步骤:将输入数据输入Bert预训练模型;其中,所述输入数据结构为(sentence1,sentence2,label),sentence1和sentence2分别表示需要分类的两个句子,label为标签,用于表示两个句子是否在对同一个问题进行辩论;提取Bert模型的CLS位置的输出向量作为句子向量表示;在得到的句子向量表示后面增加一个softma...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:成都数之联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1