一种基于深度学习的案由提取方法和装置制造方法及图纸

技术编号:41536067 阅读:31 留言:0更新日期:2024-06-03 23:14
本申请公开了一种基于深度学习的案由提取方法和装置。方法包括:对历史法律文本数据进行清洗、预处理和数据标注,指示案由的位置;将历史法律文本数据划分为训练集、验证集和测试集;利用训练集训练深度学习神经网络模型,并利用训练集对预训练神经网络模型进行微调;获取目标法律文本数据,将目标法律文本数据输入到深度学习神经网络模型中,得到相应案由序列;并将目标法律文本数据输入到预训练神经网络模型中,得到相应文章总结;比较案由序列与文章总结中的潜在案由之间的相似度;基于相似度,结合标准案由大全,判断案由序列是否准确;若判定案由序列准确,输出案由序列。本申请可以有效提高案由提取的准确率,具有更好的泛化能力和适应性。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种案由提取方法和装置。


技术介绍

1、

2、

3、现有的案由提取方法中,准确率较低是一个普遍存在的问题。基于规则或关键词匹配的方法受限于事先设定的规则和词库,难以适应法律文本的多样性和复杂性。此外,由于案由的表述方式灵活多样,传统方法往往依赖于人工编制的模板或规则,对于新的案件类型或变化的法律问题,需要耗费大量时间和资源进行调整和更新。


技术实现思路

1、本申请提供一种案由提取方法和装置,旨在解决现有案由提取方法准确率较低的技术问题。

2、第一方面,一种基于深度学习的案由提取方法,包括:

3、s1,从多个领域收集历史法律文本数据,对所述历史法律文本数据进行数据清洗和预处理;

4、s2,对所述历史法律文本数据进行数据标注,指示所述历史法律文本数据中案由的位置;

5、s3,将所述历史法律文本数据划分为训练集、验证集和测试集;

6、s4,利用所述训练集训练深度学习神经网络模型,并利用所述训练集对预训练本文档来自技高网...

【技术保护点】

1.一种基于深度学习的案由提取方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述对所述历史法律文本数据进行数据清洗和预处理,包括:

3.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述深度学习神经网络包括输入层、BiLSTM层和CRF层;所述输入层用于将法律文本数据表示为词嵌入或字词嵌入;所述BiLSTM层用于学习文本中的上下文信息;所述CRF层用于建模标签序列的依赖性关系。

4.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述预训练神经网络模型为BERT-Base-Chine...

【技术特征摘要】

1.一种基于深度学习的案由提取方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述对所述历史法律文本数据进行数据清洗和预处理,包括:

3.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述深度学习神经网络包括输入层、bilstm层和crf层;所述输入层用于将法律文本数据表示为词嵌入或字词嵌入;所述bilstm层用于学习文本中的上下文信息;所述crf层用于建模标签序列的依赖性关系。

4.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述预训练神经网络模型为bert-base-chinese模型。

5.根据权利要求4所述的基于深度学习的案由提取方法,其特征在于,利用所述训练集对预训练神经网络模型...

【专利技术属性】
技术研发人员:王荣刚
申请(专利权)人:北京汉王影研科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1