一种面向裁判文书的伤亡人数提取方法技术

技术编号:37623251 阅读:34 留言:0更新日期:2023-05-18 12:14
本发明专利技术公开了一种面向裁判文书的伤亡人数提取方法,其步骤包括:1)对公开裁判文书集中的每一裁判文书进行分段处理,得到关联集合A1;2)从集合A1内每一裁判说理段中提取伤亡人数,将每一裁判文书的事实认定段、裁判说理段和伤亡人数作为一短文本,构建事实认定

【技术实现步骤摘要】
一种面向裁判文书的伤亡人数提取方法


[0001]本专利技术属于自然语言处理领域和裁判文书中有关伤亡人数的研究领域,涉及一种面向裁判文书的伤亡人数提取方法。

技术介绍

[0002]在司法领域,人工智能技术与司法制度的深度结合,是解决当前诸多司法实践所面临问题的主要途径和对策。面向案件审理全流程提供类案智能推送、检索报告智能生成、量刑智能辅助、裁判规律智能分析、准确适用法律、统一裁判尺度、文书智能辅助生成、文书智能纠错等裁判辅助应用,进一步利用大数据、区块链、人工智能等新技术提供精准智能辅助功能,提高司法公信力,全面实现审判智能化辅助。其中伤亡人数的提取作为类案智能推送、量刑智能辅助、文书智能辅助生成等裁判辅助应用中不可或缺的一部分,其提取的精准度严重影响法官对各个裁判辅助应用的使用效果。
[0003]目前,伤亡人数提取主要依赖法律专家和知识工程师人工制定诸如“重伤[1一]人”等提取规则。虽然取得了阶段性的成果,但是它要求裁判文书必须写明具体的伤亡人数,对于需要运用语义理解才能推理出伤亡人数的表述则无能为力,如“李某某、王某某重伤”等。近年本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向裁判文书的伤亡人数提取方法,其步骤包括:1)对公开裁判文书集中的每一裁判文书进行分段处理,得到裁判文书的事实认定段

裁判说理段关联集合A1;2)从所述事实认定段

裁判说理段关联集合A1内每一裁判说理段中提取伤亡人数,将每一裁判文书的事实认定段、裁判说理段和伤亡人数作为一个短文本,构建事实认定

裁判说理

伤亡人数关联集合A2;3)对所述事实认定

裁判说理

伤亡人数关联集合A2中的每一短文本进行语义解析,识别出每个短文本中的人物类实体和其在对应短文本中的起止位置,得到数据集A3;利用伤亡类型关键词和解语知识标注方法对数据集A3进行标注,构建伤亡人数训练样本集合A4;4)基于所述伤亡人数训练样本集合A4训练基于提示学习的统一信息抽取模型,得到伤亡人数识别模型;5)对于一给定裁判文书的事实认定描述,采用所述伤亡人数识别模型,识别出该给定裁判文书中的伤亡人数。2.根据权利要求1所述的方法,其特征在于,对公开裁判文书集进行分段处理,并抽取出其中的事实认定段和裁判说理段构造出事实认定

裁判说理段关联数据集合其中B
i
表示第i篇裁判文书对应的事实认定段,C
i
表示第i篇裁判文书对应的裁判说理段,N为公开裁判文书集中裁判文书的总数。3.根据权利要求2所述的方法,其特征在于,构建所述事实认定

裁判说理

伤亡人数关联集合A2的具体步骤包括:首先利用设定的伤亡人数提取规则对所述事实认定段

裁判说理段关联集合A1中的裁判说理段进行提取,得到裁判文书对应的伤亡人数集合D
i
为第i篇裁判文书对应的伤亡人数;然后对伤亡人数集合和事实认定

裁判说理段关联数据集合进行融合关联,得到事实认定

裁判说理

伤亡人数关联集合4.根据权利要求3所述的方法,其特征在于,构建所述伤亡人数训练样本集合A4的具体步骤包括:31)构建伤亡人数关键词集合,利用伤亡人数关键词集合中每一关键词对所述事实认定

裁判说理

伤亡人数关联集合A2中的每一事实认定段进行切分,得到对应伤亡类型的表述...

【专利技术属性】
技术研发人员:魏芸菲刘贤艳徐斌吴正午孙晓锐谭晓颖
申请(专利权)人:中国司法大数据研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1