合同条款自动审核方法及系统技术方案

技术编号:36433543 阅读:23 留言:0更新日期:2023-01-20 22:46
本发明专利技术公开了一种合同条款自动审核方法及系统,该方法包括:获取合同文本;对所述合同文本进行拆分,得到所有条款和/或段落;对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率;如果所述风险类别标签的概率大于设定的概率阈值,则确定所述条款和/或段落存在风险,并将存在风险的条款和/或段落作为分类风险条款。利用本发明专利技术方案,可以有效提升合同条款审查效率及准确率。查效率及准确率。查效率及准确率。

【技术实现步骤摘要】
合同条款自动审核方法及系统


[0001]本专利技术涉及信息处理
,具体涉及一种合同条款自动审核方法及系统。

技术介绍

[0002]现代企业管理中存在大量的商业活动,而这些商业活动得以顺利开展,就需要交易双方建立起相应的契约,即合同文件。合同的质量好坏,双方权利与义务约定的合理与否,合同条款是否存在法律合规风险,直接会影响到商业活动乃至企业的成败。而一个企业中往往只存在少量的法务人员,不同法务人员的专业水平也参差不齐,所以人工审核大量合同就会存在耗时、低效、繁杂、不严谨等问题。随着搜索引擎技术的发展以及企业合同管理水平的提升,一些企业会通过人工的方式建立风险条款库。对于待审查的合同文本,会通过信息检索技术去匹配风险库,如果匹配到相应的风险条款,则认为该合同文本存在相应的风险。通过信息检索的方式相对人工的方式,大大提升了效率。但是当前主流的信息检索技术采用的是BM25算法,该算法会以待检索合同条款和风险条款库作为输入,输出风险库中相关的风险条款相对输入条款的一个排序结果,排在最前面的就是匹配最高的风险条款,如果匹配最高的条款匹配度超过某个阈值,则可以认为待检索合同条款存在这样的风险。现有的风险条款检索方法主要包括以下步骤:第一步,会采用分词算法提取待检索合同文本条款的特征词集合;第二步,根据风险库中的条款是否包含特征词集合的特征词,划定出待排序的风险条款集合;第三步,计算出待查询条款和风险条款集合中每个条款的相关度评分;第四步,依据评分的排序结果以及定义的阈值判断条件给出匹配的风险条款。基于风险条款检索的方式,主要是基于文本中存在的关键词、关键词的统计权重以及文本的长度组合给出最终的评分,这种方式对于准确率要求不高的场景会有不错的效果。但是合同条款审查场景对于准确率要求较高,现有的通过信息检索的方式无法满足这种场景的需求。

技术实现思路

[0003]本专利技术提供一种合同条款自动审核方法及系统,以提升合同条款审查效率及准确率。
[0004]为此,本专利技术提供如下技术方案:
[0005]一种合同条款自动审核方法,所述方法包括:
[0006]获取合同文本;
[0007]对所述合同文本进行拆分,得到所有条款和/或段落;
[0008]利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率;
[0009]如果所述风险类别标签的概率大于设定的概率阈值,则确定所述条款和/或段落存在风险,并将存在风险的条款和/或段落作为分类风险条款。
[0010]可选地,所述对所述合同文本进行拆分,得到所有条款和/或段落包括:
[0011]根据所述合同文本的内在逻辑结构对所述合同文本进行拆分,得到所有条款和/或段落;或者
[0012]根据所述合同文本的样式结构对所述合同文本进行拆分,得到所有条款和/或段落。
[0013]可选地,所述利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率包括:
[0014]利用所述条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签的概率分布;
[0015]选取所述风险标签的概率分布中最大的风险类别标签作为所述条款和/或段落的风险类别标签。
[0016]可选地,所述方法还包括按以下方式构建所述条款分类模型:
[0017]收集风险条款文本以及所述风险条款文本对应的风险类别标签;
[0018]对所述风险条款文本以及所述风险条款文本对应的风险类别标签进行处理,得到训练数据集;
[0019]搭建条款分类模型结构,所述条款分类模型采用bert分类模型;模型第一层为bert预训练语言模型层,模型的第二层是全连接层,模型的第三层是softmax层;
[0020]利用所述训练数据集对所述bert分类模型进行训练,得到条款分类模型。
[0021]可选地,所述方法还包括:如果所述分类标签的概率小于等于所述分类标签对应的阈值,则通过检索方式确定所述条款和/或段落是否为检索风险条款。
[0022]可选地,所述通过检索方式确定所述条款和/或段落是否为检索风险条款包括:
[0023]将所述条款和/或段落的内容作为输入,调用检索引擎得到多个检索结果及各检索结果对应的评分;
[0024]如果所述检索结果对应的最高评分大于设定的评分阈值,则确定所述条款和/或段落为检索风险条款,否则确定所述条款和/或段落为无风险条款。
[0025]可选地,所述评分为利用bm25算法计算的评分。
[0026]可选地,所述方法还包括:聚合所述分类风险条款、所述检索风险条款、以及所述无风险条款,得到条款审查结果。
[0027]一种合同条款自动审核系统,所述系统包括:
[0028]合同文本获取模块,用于获取合同文本;
[0029]拆分模块,用于对所述合同文本进行拆分,得到所有条款和/或段落;
[0030]分类模块,用于利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率;
[0031]第一判断模块,用于在所述风险类别标签的概率大于设定的概率阈值的情况下,确定所述条款和/或段落存在风险,并将存在风险的条款和/或段落作为分类风险条款。
[0032]可选地,所述拆分模块,具体用于根据所述合同文本的内在逻辑结构对所述合同文本进行拆分,得到所有条款和/或段落;或者根据所述合同文本的样式结构对所述合同文本进行拆分,得到所有条款和/或段落。
[0033]可选地,所述分类模块包括:
[0034]分类单元,用于利用所述条款分类模型对所述条款和/或段落进行分类,得到所述
条款和/或段落对应的风险类别标签的概率分布;
[0035]选取单元,用于选取所述风险标签的概率分布中最大的风险类别标签作为所述条款和/或段落的风险类别标签。
[0036]可选地,所述系统还包括:检索模块;所述检索模块,用于在所述分类标签的概率小于等于所述分类标签对应的阈值的情况下,通过检索方式确定所述条款和/或段落是否为检索风险条款。
[0037]可选地,所述检索模块包括:
[0038]调用模块,用于将所述条款和/或段落的内容作为输入,调用条款检索引擎得到多个检索结果及各检索结果对应的评分;
[0039]第二判断模块,用于在所述检索结果对应的最高评分大于设定的评分阈值的情况下,确定所述条款和/或段落为检索风险条款,否则确定所述条款和/或段落为无风险条款。
[0040]可选地,所述系统还包括:聚合模块,用于聚合所述分类风险条款、所述检索风险条款、以及所述无风险条款,得到条款审查结果。
[0041]本专利技术提供的合同条款自动审核方法及系统,利用条款分类模型对合同条款和/或段落进行分类,得到条款和/或段落对应的风险类别标签及所述风险类别标签的概率;根据所述概本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合同条款自动审核方法,其特征在于,所述方法包括:获取合同文本;对所述合同文本进行拆分,得到所有条款和/或段落;利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率;如果所述风险类别标签的概率大于设定的概率阈值,则确定所述条款和/或段落存在风险,并将存在风险的条款和/或段落作为分类风险条款。2.根据权利要求1所述的方法,其特征在于,所述对所述合同文本进行拆分,得到所有条款和/或段落包括:根据所述合同文本的内在逻辑结构对所述合同文本进行拆分,得到所有条款和/或段落;或者根据所述合同文本的样式结构对所述合同文本进行拆分,得到所有条款和/或段落。3.根据权利要求1所述的方法,其特征在于,所述利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签及所述风险类别标签的概率包括:利用所述条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险类别标签的概率分布;选取所述风险标签的概率分布中最大的风险类别标签作为所述条款和/或段落的风险类别标签。4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:如果所述分类标签的概率小于等于所述分类标签对应的阈值,则通过检索方式确定所述条款和/或段落是否为检索风险条款。5.一种合同条款自动审核系统,其特征在于,所述系统包括:合同文本获取模块,用于获取合同文本;拆分模块,用于对所述合同文本进行拆分,得到所有条款和/或段落;分类模块,用于利用条款分类模型对所述条款和/或段落进行分类,得到所述条款和/或段落对应的风险...

【专利技术属性】
技术研发人员:张森
申请(专利权)人:卓望信息技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1