【技术实现步骤摘要】
基于论据生成的刑事案件判决预测方法、介质及设备
[0001]本专利技术涉及自然语言处理领域,尤其涉及一种基于论据生成的刑事案件判决预测方法、介质及设备。
技术介绍
[0002]随着案件数量的逐年增加,基层法院中存在着严重的“案多人少”的现象,因此,利用计算机技术进行智能司法辅助处理是具有实际应用意义。深度学习方法,尤其是自然语言处理技术已经对许多司法辅助任务带来了提升,比如争议焦点挖掘,庭审对话生成等。作为司法判决中最重要的一环,判决预测任务已经被研究了数十年。判决预测任务的目的是根据给定的事实描述,给出法条、罪名和刑期的预测结果。在司法实践中,法官通常会分步得到结果:他们首先根据事实总结出论据,然后再得到判决。然而,现有的技术更聚焦于如何通过端到端的方法提取有效的特征,忽视了系统在现实应用中的可交互性和可解释性。
[0003]为了提升刑期预测方法的实用性和效率,有两个挑战亟待解决。首先,预测过程不能被人为介入,司法任务需要高准确率,但现有的方法都是端到端的,预测的过程是“黑盒”的。在实际应用中,法官无法在预测过程中 ...
【技术保护点】
【技术特征摘要】
1.一种基于论据生成的刑事案件判决预测方法,其特征在于,包括如下步骤:S1:获取包含单个样本中包含事实描述、定罪论据、量刑论据和判决结果的训练集;所述判决结果包含适用的法条、罪名和刑期;S2:利用通过所述训练集训练得到的论据生成模块,从目标刑事案件的事实描述中生成定罪论据和量刑论据;S3:利用层次化序列模型,提取事实描述和所述论据生成模块生成的定罪论据和量刑论据中的特征,并根据判决结果预测任务之间逻辑上的拓扑关系利用拓扑注意力机制进行对应特征的加权聚合;S4:利用通过所述训练集训练得到的判决预测模块,基于所述层次化序列模型中加权聚合后的特征信息,分别通过三个预测器对目标刑事案件的适用的法条、罪名和刑期进行预测。2.如权利要求1所述的基于论据生成的刑事案件判决预测方法,其特征在于,所述S1的具体步骤包括:S101:从裁判文书中提取事实描述、法院观点和判决结果,并且利用关键字从法院观点中提取定罪论据和量刑论据;所述事实描述是一段描述性的语句,包含了法院认定查明的事实,表示为其中表示事实描述中的第t个词,l
f
表示事实描述中总的词数;所述定罪论据和量刑论据分别是刑事案件中对于定罪和量刑的判决依据,分别表示为定罪论据和量刑论据其中表示定罪论据中的第t个词,l
cr
表示定罪论据中总的词数,表示量刑论据中的第t个词,l
pr
表示量刑论据中总的词数;所述判决结果包含由事实描述和论据决定的法条、罪名和刑期,分别表示为a、c和p。S102:将S101中从裁判文书中提取的信息表示为六元组(f,cr,pr,a,c,p)形式的训练样本。3.如权利要求2所述的基于论据生成的刑事案件判决预测方法,其特征在于,所述S2中,论据生成模块由文本生成模型通过所述训练集训练后得到,其输入为事实描述f,输出为生成的定罪论据cr和量刑论据pr;所述文本生成模型为基于Transformer的生成模型BART或基于LSTM的生成模型PGN;且所述定罪论据cr和量刑论据pr通过联合生成模式或独立生成模式生成,所述联合生成模式为采用一个共享编码器生成两个论据,所述独立生成模式为采用两个单独编码器分别生成两个不同的论据。4.如权利要求3所述的基于论据生成的刑事案件判决预测方法,其特征在于,所述S3中,层次化序列模型中获得加权聚合后的特征信息的具体步骤包括:S301:对于输入的事实描述f、定罪论据cr和量刑论据pr三个词序列,首先将每个词映射成由300维向量表示的词嵌入,然后将这三个词嵌入序列通过编码器得到三个隐藏状态序列h
f
、h
cr
和h
pr
;S302:利用拓扑注意力机制来聚合事实描述和生成的定罪论据和量刑论据中的特征,
得到聚合了事实描述和论据的两个表达和和和其中:表示序列h
f
的元素均值,Att()表示注意力机制,对于任意序列x和值y,注意力机制Att(x,y)对于每个序列χ的注意力分布q通过下式计算得到:e
i
=v
T
tanh(W
x
x
i
+W
y
y+b)q=softmax(e
i
)其中v,W
x
,W
y
,b都是需要学习的参数;注意力分布q是论据中每个词对于事实描述中某个词的重要性分布;经过注意力机制聚合后的表达如下:式中:q
i
和x
i
分别为向量形式的q和x中的第i个元素。5.如权利要求4所述的基于论据生成的刑事案件判决预...
【专利技术属性】
技术研发人员:孙常龙,吴飞,况琨,鲁伟明,吴亦全,刘翼飞,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。