【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种案由提取方法和装置。
技术介绍
1、
2、
3、现有的案由提取方法中,准确率较低是一个普遍存在的问题。基于规则或关键词匹配的方法受限于事先设定的规则和词库,难以适应法律文本的多样性和复杂性。此外,由于案由的表述方式灵活多样,传统方法往往依赖于人工编制的模板或规则,对于新的案件类型或变化的法律问题,需要耗费大量时间和资源进行调整和更新。
技术实现思路
1、本申请提供一种案由提取方法和装置,旨在解决现有案由提取方法准确率较低的技术问题。
2、第一方面,一种基于深度学习的案由提取方法,包括:
3、s1,从多个领域收集历史法律文本数据,对所述历史法律文本数据进行数据清洗和预处理;
4、s2,对所述历史法律文本数据进行数据标注,指示所述历史法律文本数据中案由的位置;
5、s3,将所述历史法律文本数据划分为训练集、验证集和测试集;
6、s4,利用所述训练集训练深度学习神经网络模型,并利
...【技术保护点】
1.一种基于深度学习的案由提取方法,其特征在于,包括:
2.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述对所述历史法律文本数据进行数据清洗和预处理,包括:
3.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述深度学习神经网络包括输入层、BiLSTM层和CRF层;所述输入层用于将法律文本数据表示为词嵌入或字词嵌入;所述BiLSTM层用于学习文本中的上下文信息;所述CRF层用于建模标签序列的依赖性关系。
4.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述预训练神经网络模型为BERT-
...【技术特征摘要】
1.一种基于深度学习的案由提取方法,其特征在于,包括:
2.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述对所述历史法律文本数据进行数据清洗和预处理,包括:
3.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述深度学习神经网络包括输入层、bilstm层和crf层;所述输入层用于将法律文本数据表示为词嵌入或字词嵌入;所述bilstm层用于学习文本中的上下文信息;所述crf层用于建模标签序列的依赖性关系。
4.根据权利要求1所述的基于深度学习的案由提取方法,其特征在于,所述预训练神经网络模型为bert-base-chinese模型。
5.根据权利要求4所述的基于深度学习的案由提取方法,其特征在于,利用所述训练集对预训练神经网络模型...
【专利技术属性】
技术研发人员:王荣刚,
申请(专利权)人:北京汉王影研科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。