基于深度学习的合同分类方法、系统及相关设备技术方案

技术编号:37154914 阅读:29 留言:0更新日期:2023-04-06 22:15
本发明专利技术公开了一种基于深度学习的合同分类方法、系统及相关设备,方法包括:获取待分类合同的合同标题,根据上述合同标题,通过已训练的标题分类模型获取标题类别,其中,上述标题类别是多种预设类别中的任意一种;根据上述标题类别从预设的多个已训练的内容分类模型中选择获取一个目标内容分类模型,其中,一个上述已训练的内容分类模型与一种上述预设类别对应;获取上述待分类合同的合同内容,根据上述合同内容,通过上述目标内容分类模型获取上述待分类合同对应的合同类别;其中,上述标题分类模型和上述内容分类模型是基于深度学习的神经网络模型。与现有技术中相比,本发明专利技术方案有利于提高合同分类的准确性。方案有利于提高合同分类的准确性。方案有利于提高合同分类的准确性。

【技术实现步骤摘要】
基于深度学习的合同分类方法、系统及相关设备


[0001]本专利技术涉及文本分类
,尤其涉及的是一种基于深度学习的合同分类方法、系统及相关设备。

技术介绍

[0002]随着社会经济的发展,人们对于合同的签订需求越来越大,对于合同的合理管理也越来越受到重视。对合同进行管理时,需要进行合同分类。
[0003]现有技术中,通常使用一个文本分类模型进行合同分类,具体的,将合同中的所有内容都输入到一个文本分类模型,以通过该文本分类模型进行合同分类。现有技术的问题在于,使用一个文本分类模型针对整个合同的内容进行分类时,需要对合同的所有内容进行相同的处理,未考虑到合同的各个不同部分对于合同分类的不同影响,不利于提高合同分类的准确性。
[0004]因此,现有技术还有待改进和发展。

技术实现思路

[0005]本专利技术的主要目的在于提供一种基于深度学习的合同分类方法、系统及相关设备,旨在解决现有技术中使用一个文本分类模型针对整个合同的内容进行分类时未考虑到合同的各个不同部分对于合同分类的不同影响,不利于提高合同分类的准确性的问本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的合同分类方法,其特征在于,所述方法包括:获取待分类合同的合同标题,根据所述合同标题,通过已训练的标题分类模型获取标题类别,其中,所述标题类别是多种预设类别中的任意一种;根据所述标题类别从预设的多个已训练的内容分类模型中选择获取一个目标内容分类模型,其中,一个所述已训练的内容分类模型与一种所述预设类别对应;获取所述待分类合同的合同内容,根据所述合同内容,通过所述目标内容分类模型获取所述待分类合同对应的合同类别;其中,所述标题分类模型和所述内容分类模型是基于深度学习的神经网络模型。2.根据权利要求1所述的基于深度学习的合同分类方法,其特征在于,所述获取待分类合同的合同标题,根据所述合同标题,通过已训练的标题分类模型获取标题类别,包括:获取所述待分类合同的合同标题;通过预设的特征提取器对所述合同标题进行特征提取并获得所述合同标题对应的标题特征向量;将所述标题特征向量输入所述已训练的标题分类模型并获得所述标题分类模型输出的标题类别。3.根据权利要求2所述的基于深度学习的合同分类方法,其特征在于,所述获取所述待分类合同的合同内容,根据所述合同内容,通过所述目标内容分类模型获取所述待分类合同对应的合同类别,包括:获取所述待分类合同的合同内容;根据所述合同内容,通过所述预设的特征提取器提取获得所述合同内容对应的内容特征向量;将所述内容特征向量输入所述目标内容分类模型并获得所述目标内容分类模型输出的所述待分类合同对应的合同类别。4.根据权利要求3所述的基于深度学习的合同分类方法,其特征在于,所述内容特征向量由第一内容特征子向量和第二内容特征子向量拼接构成,所述根据所述合同内容,通过所述预设的特征提取器提取获得所述合同内容对应的内容特征向量,包括:根据预设的预处理操作对所述合同内容进行处理后获得预处理内容,其中,所述预处理操作包括删除停用词;根据预设的合同划分字数阈值将所述预处理内容划分为第一部分内容和第二部分内容,其中,当所述预处理内容的总字数不超过所述合同划分字数阈值时,所述第一部分内容包括所有所述预处理内容,所述第二部分内容为空,当所述预处理内容的总字数超过所述合同划分字数阈值时,所述第一部分内容包括所述预处理内容的前合同划分字数阈值个字,所述第二部分内容包括所述预处理内容中除所述第一部分内容以外的所有内容;通过所述预设的特征提取器对所述第一部分内容进行特征提取并获得所述第一内容特征子向量;通过所述预设的特征提取器对所述第二部分内容进行特征提取并获得所述第二内容特征子向量,其中,当所述第二部分内容为空时,所述第二内容特征子向量为空向量;将所述第一内容特征子向量和所述第二内容特征子向量拼接获得所述内容特征向量。5.根据权利要求4所述的基于深度学习的合同分类方法,其特征在于,当所述第二部分
内容不为空时,所述通过所述预设的特征提取器对所述第二部分内容进行特征提取并获得所述第二内容特征子向量,包括:对所述第二部分内容进行语句划分获得多个待处理语句;分别计算各所述待处理语句对应的词频

逆文档频率;获取目标语句数目,从所述多个待处理语句中选择词频

逆文档频率最高的目标语句数目个待处理语句并组成一个目标段落;...

【专利技术属性】
技术研发人员:薛自强杨敏雷宇
申请(专利权)人:深圳得理科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1