合同类别的识别方法及其装置、电子设备及存储介质制造方法及图纸

技术编号:39243061 阅读:7 留言:0更新日期:2023-10-30 11:55
本发明专利技术公开了一种合同类别的识别方法及其装置、电子设备及存储介质,涉及人工智能领域,其中,该识别方法包括:获取目标合同,对合同数据进行处理,确定领域关键字以及多条协议数据,将每条协议数据与领域关键字进行组合,生成特征数据,将特征数据输入至预设识别模型,输出目标合同的合同类别。本发明专利技术解决了相关技术中人工对合同类别进行识别的准确性较低的技术问题。低的技术问题。低的技术问题。

【技术实现步骤摘要】
合同类别的识别方法及其装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,具体而言,涉及一种合同类别的识别方法及其装置、电子设备及存储介质。

技术介绍

[0002]合同效力对于金融机构的法律风险防控至关重要,一旦合同被认定为无效,金融机构将面临担保悬空、资金损失等一系列风险。传统上,认为只有违反法律、行政法规等强制性规定才会导致合同无效,违反金融规章并不会导致合同无效。但是,当前对于违反金融规章的合同也会被认定无效,因此,金融规章对合同效力的影响将越来越大。
[0003]相关技术中,判断合同是否无效的方法主要是审查人员根据自身经验、专业知识以及查阅文献进行人工判断。然而,相关技术中的判断合同是否无效的方法存在如下问题:(1)由人工判断处理,缺乏自动化处理机制,工作繁琐且效率不高;(2)需要参考的监管文件数量极为庞杂,金融机构的审查人员很难全面掌握,由于个体间理解、认知及经验的差异,导致所做判定结果存在差异;(3)是否违背公序良俗、是否遵循各种规章等问题均有较强的自由裁量权因素,只有在案件的判决书中方有清晰的论述和判断,需要人工查阅大量的相关案件进行参考。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种合同类别的识别方法及其装置、电子设备及存储介质,以至少解决相关技术中人工对合同类别进行识别的准确性较低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种合同类别的识别方法,包括:获取目标合同,其中,所述目标合同包括:合同数据;对所述合同数据进行处理,确定领域关键字以及多条协议数据;将每条所述协议数据与所述领域关键字进行组合,生成特征数据;将所述特征数据输入至预设识别模型,输出所述目标合同的合同类别,其中,所述预设识别模型是基于预设规则训练得到的模型,所述合同类别为下述之一:无效合同、有效合同。
[0007]可选地,所述识别方法还包括:采集历史合同集合以及文书数据集合,其中,所述历史合同集合包括:多个历史合同,所述文书数据集合中的每条文书数据对应一个所述历史合同;基于所述文书数据集合,对所述历史合同进行标注,得到所述历史合同的合同标签;对所有所述历史合同进行处理,得到特征组合数据;采用所述特征组合数据对初始识别模型进行训练,得到所述预设识别模型。
[0008]可选地,基于所述文书数据集合,对所述历史合同进行标注,得到所述历史合同的合同标签的步骤,包括:确定预设关键字集合,并基于所述预设关键字集合,构建所述预设规则;基于所述预设规则,分析每条所述文书数据,得到所述文书数据对应的文书类别,其中,所述文书类别为下述之一:有效类别、无效类别;在所述文书类别为所述有效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为
有效标签;在所述文书类别为所述无效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为无效标签。
[0009]可选地,所述历史合同包括:多个特征值,在对所有所述历史合同进行处理,得到特征组合数据之前,还包括:统计所述历史合同中的所述特征值为空值的空值数量;在所述空值数量大于预设缺失阈值的情况下,删除所述历史合同,得到初始历史合同集合;分析所述初始历史合同集合中每个初始历史合同中的协议数据,得到所述协议数据的协议类型,并在所述协议类型不属于预设协议类型集合的情况下,删除所述初始历史合同中所述协议类型指示的所述协议数据,得到预设历史合同集合;对所述预设历史合同集合中每个预设历史合同的所述特征值进行处理,得到目标历史合同集合。
[0010]可选地,对所有所述历史合同进行处理,得到特征组合数据的步骤,包括:确定所述目标历史合同集合中每个目标历史合同包含的所述协议数据;确定所述协议数据的所述协议类型,并将属于同一所述协议类型的所述协议数据划分为同一协议数据集合;将所述协议数据集合中每条所述协议数据与所述领域关键字进行组合,得到特征数据集合;基于所有所述特征数据集合,生成所述特征组合数据。
[0011]可选地,在采用所述特征组合数据对初始识别模型进行训练,得到所述预设识别模型之前,还包括:确定所述特征组合数据的数据标注状态以及合同的识别状态;基于所述数据标注状态以及所述识别状态,确定模型算法集合,其中,所述模型算法集合包括:多个模型算法;构建与所述模型算法对应的所述初始识别模型。
[0012]可选地,采用所述特征组合数据对初始识别模型进行训练,得到所述预设识别模型的步骤,包括:将所述特征组合数据划分为训练数据集以及测试数据集;采用所述训练数据集训练所述初始识别模型,直到采用损失函数确定的损失值在预设次数内都相等,确定对所述初始识别模型训练完成,其中,所述损失值是基于所述初始识别模型的输出值以及合同标签对应的标签值采用损失函数确定的;采用所述测试数据集测试每个所述初始识别模型,得到测试值;对所有所述测试值进行排序,并将最大测试值指示的所述初始识别模型表征为所述预设识别模型。
[0013]根据本专利技术实施例的另一方面,还提供了一种合同类别的识别装置,包括:获取单元,用于获取目标合同,其中,所述目标合同包括:合同数据;处理单元,用于对所述合同数据进行处理,确定领域关键字以及多条协议数据;组合单元,用于将每条所述协议数据与所述领域关键字进行组合,生成特征数据;输入单元,用于将所述特征数据输入至预设识别模型,输出所述目标合同的合同类别,其中,所述预设识别模型是基于预设规则训练得到的模型,所述合同类别为下述之一:无效合同、有效合同。
[0014]可选地,所述识别装置还包括:第一采集模块,用于采集历史合同集合以及文书数据集合,其中,所述历史合同集合包括:多个历史合同,所述文书数据集合中的每条文书数据对应一个所述历史合同;第一标注模块,用于基于所述文书数据集合,对所述历史合同进行标注,得到所述历史合同的合同标签;第一处理模块,用于对所有所述历史合同进行处理,得到特征组合数据;第一训练模块,用于采用所述特征组合数据对初始识别模型进行训练,得到所述预设识别模型。
[0015]可选地,所述第一标注模块包括:第一构建子模块,用于确定预设关键字集合,并基于所述预设关键字集合,构建所述预设规则;第一分析子模块,用于基于所述预设规则,
分析每条所述文书数据,得到所述文书数据对应的文书类别,其中,所述文书类别为下述之一:有效类别、无效类别;第一标注子模块,用于在所述文书类别为所述有效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为有效标签;第二标注子模块,用于在所述文书类别为所述无效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为无效标签。
[0016]可选地,所述历史合同包括:多个特征值,所述识别装置还包括:第一统计模块,用于在对所有所述历史合同进行处理,得到特征组合数据之前,统计所述历史合同中的所述特征值为空值的空值数量;第一删除模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合同类别的识别方法,其特征在于,包括:获取目标合同,其中,所述目标合同包括:合同数据;对所述合同数据进行处理,确定领域关键字以及多条协议数据;将每条所述协议数据与所述领域关键字进行组合,生成特征数据;将所述特征数据输入至预设识别模型,输出所述目标合同的合同类别,其中,所述预设识别模型是基于预设规则训练得到的模型,所述合同类别为下述之一:无效合同、有效合同。2.根据权利要求1所述的识别方法,其特征在于,所述识别方法还包括:采集历史合同集合以及文书数据集合,其中,所述历史合同集合包括:多个历史合同,所述文书数据集合中的每条文书数据对应一个所述历史合同;基于所述文书数据集合,对所述历史合同进行标注,得到所述历史合同的合同标签;对所有所述历史合同进行处理,得到特征组合数据;采用所述特征组合数据对初始识别模型进行训练,得到所述预设识别模型。3.根据权利要求2所述的识别方法,其特征在于,基于所述文书数据集合,对所述历史合同进行标注,得到所述历史合同的合同标签的步骤,包括:确定预设关键字集合,并基于所述预设关键字集合,构建所述预设规则;基于所述预设规则,分析每条所述文书数据,得到所述文书数据对应的文书类别,其中,所述文书类别为下述之一:有效类别、无效类别;在所述文书类别为所述有效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为有效标签;在所述文书类别为所述无效类别的情况下,将与所述文书类别指示的所述文书数据对应的所述历史合同的所述合同标签标注为无效标签。4.根据权利要求2所述的识别方法,其特征在于,所述历史合同包括:多个特征值,在对所有所述历史合同进行处理,得到特征组合数据之前,还包括:统计所述历史合同中的所述特征值为空值的空值数量;在所述空值数量大于预设缺失阈值的情况下,删除所述历史合同,得到初始历史合同集合;分析所述初始历史合同集合中每个初始历史合同中的协议数据,得到所述协议数据的协议类型,并在所述协议类型不属于预设协议类型集合的情况下,删除所述初始历史合同中所述协议类型指示的所述协议数据,得到预设历史合同集合;对所述预设历史合同集合中每个预设历史合同的所述特征值进行处理,得到目标历史合同集合。5.根据权利要求4所述的识别方法,其特征在于,对所有所述历史合同进行处理,得到特征组合数据的步骤,包括:确定所述目标历史合同集...

【专利技术属性】
技术研发人员:甘姚红朱瑶陈雪峰
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1