【技术实现步骤摘要】
面向不平衡司法裁判文书数据的法条推荐方法及系统
[0001]本专利技术涉及司法庭审辅助
,特别涉及一种面向不平衡司法裁判文书数据的法条推荐方法及系统。
技术介绍
[0002]随着法治进程的加快,公民的诉权和可诉范围随之扩大,各级法院每年都在审理越来越多的司法案件,法院中“案多人少”的问题变得更加严重。同时,由于法官判案过程中存在一定的主观倾向性因素,出现“同案不同判”的问题,长时间以来影响着司法公正性。基于人工智能技术的法律条文(简称:法条)推荐方法能够通过从司法裁判文书中提取关键信息并进行分析,提供预测出的法律条文作为法官判案的参考,以提升法官判案的效率和效果。目前,基于深层神经网络的司法法条推荐命中率在测试数据中已取得较好效果。此类方法通常由两阶段操作实现:首先,从裁判文书中提取事实向量文本特征;其次,将提取的特征输入到训练好的深层神经网络中,输出预测的司法法条。然而,由于实际司法判决存在法条类别数量繁多(超过1000以上法条类别)、实际案件类型及所依据的法条极度不平衡(不平衡比超过1:2500,常见研究主要关注不 ...
【技术保护点】
【技术特征摘要】
1.一种面向不平衡司法裁判文书数据的法条推荐方法,其特征在于,包括如下步骤:S1,将获取的司法裁判文书数据输入模型,对原始的裁判文书进行数据预处理,并且将预处理后的文本数据进行序列化得到模型的训练集;S2,将训练集通过基于预训练模型的嵌入层,得到文本的向量表示;S3,将文本向量通过卷积神经网络获取文本特征;S4,将训练集通过基于语法依赖信息的词语搭配算法,得到文本的词语搭配特征;S5,将文本特征和词语搭配特征通过神经网络进行融合,得到混合语义向量;S6,将混合语义向量输入到深层神经网络中,输出法条预测结果;S7,基于法条预测结果和真实司法裁判文书的法条标签,计算损失函数,应用反向传播算法学习模型中的参数,完成模型训练并用于司法案件的辅助判决。2.根据权利要求1所述的面向不平衡司法裁判文书数据的法条推荐方法,其特征在于,S1中将司法裁判文书数据进行分词、过滤无意义词、词语序列化方式进行数据处理,得到词语序列,,表示词语序列中的每个单词。3.根据权利要求2所述的面向不平衡司法裁判文书数据的法条推荐方法,其特征在于,S2中对于词语序列中的每个单词,通过基于预训练模型的嵌入层将其转换成词嵌入向量,并且得到词语序列的嵌入矩阵,。4.根据权利要求3所述的面向不平衡司法裁判文书数据的法条推荐方法,其特征在于,S4中通过句中词语语法依赖信息获取词语的搭配信息,并通过结合注意力机制的双向长短期记忆神经网络将搭配的单词向量合并,得到词语搭配特征。5.根据权利要求4所述的面向不平衡司法裁判文书数据的法条推荐方法,其特征在于,S4具体包括如下子步骤:S41,通过词语的依赖关系提取词语序列的词语搭配序列,,其中,代表了中的两个词;S42,将每个词转换成其对应的语义向量,得到搭配嵌入和句向量,其中是搭配词语的嵌入向量;S43,将每个单词组中的单词嵌入向量和通过一层结合注意力机制的双向长短期记忆神经网络进行合并,得到搭配语义向量,具体计算公式如下所示:其中,是第j时间下长短期记忆神经网络的正向隐藏状态,是第j时间下长短期
记忆神经网络的反向隐藏状态,计算公式如下:记忆神经网络的反向隐藏状态,计算公式如下:记忆神经网络的反向隐藏状态,计算公式如下:记忆神经网...
【专利技术属性】
技术研发人员:陈晓红,郑旭哲,梁伟,吴嘉懿,胡东滨,
申请(专利权)人:湖南工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。