一种基于自然语言理解的合同智能审查方法技术

技术编号:35409697 阅读:15 留言:0更新日期:2022-11-03 11:05
本发明专利技术涉及文档审查技术领域,且公开了一种基于自然语言理解的合同智能审查方法,所述审查方法包括如下步骤:S1、构建合同审查知识图谱:人工构建的标签体系以及审查点,共同构成合同审查知识图谱;S2、实现审查规则;算法工程师根据该知识图谱,实现具体的合同审查功能;S3、合同智能审查。该基于自然语言理解的合同智能审查方法,梳理合同审查需求,形成包含标签、审查点、审查项、审查规则、风险提示信息等内容的合同审查知识图谱,根据合同审查知识图谱训练算法模型、实现审查规则,并能根据指示图谱内容生成审查清单,并根据审查清单、审查立场的不同,智能调度相关算法模型和审查模块,最终得到合同审查结果。最终得到合同审查结果。最终得到合同审查结果。

【技术实现步骤摘要】
一种基于自然语言理解的合同智能审查方法


[0001]本专利技术属于文档审查
,具体为一种基于自然语言理解的合同智能审查方法。

技术介绍

[0002]合同是企业和企业之间商务合作的契约载体,合同审查作为企业主体日常经营不可或缺的工作内容,传统合同审查方法大量依赖人工审核操作,长期占用大量的公司法务人力资源,同时因为每个合同审核人员的经验不同、对法律法规理解不同、对风险点的把控也不同,最终合同审查的标准和结果也不一样,无形中增加了企业经营的合规和合同纠纷诉讼的风险,一套基于自然语言理解的智能的合同审查系统,可以按照法律法规的要求,结合企业经营的需要,对各类合同风险使用固定的统一标准,进行自动化的AI审查,不但可以释放企业法务的工作量,同时也可以提升合同审查的标准和规范性。
[0003]合同智能审查,作为一个新兴的功能服务,出现在一些无纸化办公服务,或是文件管理服务当中,但是这些合同审查主要通过当前合同与模版合同的做比对,通过文本的差异来判断是否存在风险,非常的机械,对法务的工作量的减轻没有明显效果,甚至增加了某些合同审查的步骤,并不能真正解决合同审查中工作繁琐、标准不统一、消耗人力等问题。

技术实现思路

[0004]针对上述情况,为克服现有技术的缺陷,本专利技术提供一种基于自然语言理解的合同智能审查方法,有效的解决了上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于自然语言理解的合同智能审查方法,所述审查方法包括如下步骤:S1、构建合同审查知识图谱:人工构建的标签体系以及审查点,共同构成合同审查知识图谱;S2、实现审查规则:算法工程师根据该知识图谱,实现具体的合同审查功能;S3、合同智能审查:合同审查之前,用户可以自行定制审查清单,每个合同类型所有的审查点,组合成该合同类型的默认审查清单,用户可以从默认审查清单中筛选出自己需要的审查点,并可以对审查点的审查点名称、子审查项名称、风险提示信息进行编辑,最终形成自己需要的审查清单,后续的智能审查功能,会依据每个审查清单所涉及到的审查点的不同,自动执行不同的审查操作。
[0006]优选的,所述S1中构建合同审查知识图谱包括如下步骤:S1

1、梳理合同审查需求,将比较抽象的合同审查需求整合成有限的几个审查点,例如货物买卖合同中会有“合同金额审查”审查点;S1

2、将审查点包含的各类风险,整合为有限的几个子审查项,每个审查项审查具体的一个风险点,例“合同金额审查”审查点下会有“金额大小写一致性”,“总金额准确性”等几个子审查项;
S1

3、根据审查点以及其子审查项,抽象出实现审查逻辑可能需要的标签,并确定标签内涵,并且随机选取一些真实合同,对上述标签进行试标注,确认在真实合同中,上述标签是否可用,内涵是否准确;S1

4、若在试标注过程中,发现某些标签设置不合理,或者内涵不准确,则重复上述两步,同时将标签以及其内涵迭代到算法可用、内涵明确的程度,将上述标签整合成有一定层级关系的标签体系,例如货物买卖合同中会有“支付”条款、“违约责任”条款,而“支付”条款下又有“货物总价”、“交付时间”等条款,将这些条款整理成一组有层级结构的标签;S1

5、根据构建的上述标签体系,以及标签内涵,标注一系列合同文本数据,并将标签体系以及标注数据同步给算法工程师,用以训练算法模型;S1

6、依据标签体系,形成审查点各子审查项的具体审查规则,例如
“‘
货物总价

标签中合同总金额,若不同时存在大写金额、小写金额、货币类型,则存在风险”;S1

7、所有审查点组成了合同审查知识图谱,图谱中包含所有标签、审查点、审查项、审查规则、风险提示信息等内容;S1

8、使用合同知识图谱同步模块将梳理好的知识图谱同步给算法工程师,用以实现审查点以及审查规则,同时根据合同智能审查实际效果,调整相关标签/审查规则等知识图谱信息,优化迭代合同审查知识图谱。
[0007]优选的,所述S2中实现审查规则括如下步骤:S2

1、使用合同知识图谱同步模块,提取标签体系相关信息,基于标签体系,将标注数据按照标签的层级结构生成模型的训练数据;S2

2、基于上述标签体系,以及训练数据,训练算法模型,使得算法能够依据人工构建的标签体系,准确识别该类合同中的各类标签、要素;S2

3、使用合同知识图谱同步模块,提取审查点、子审查项、审查规则、所涉及标签信息,利用模型标签、要素,实现每个审查点的所有子审查项的审查规则,并将这个审查点封装为可以调用的审查模块,例如在“合同总金额审查”的审查点中,使用标签模型得到合同总金额的那一段条款,再使用要素抽取模型,将这一段条款中的具体总金额要素抽取出来,使用总金额要素进一步实现后续的审查规则,将这个审查规则封装如审查模块后,这个审查点就可以随时被调用,并审查“合同总金额”的相关风险;S2

4、使用真实合同,测试合同智能审查算法效果,若审查结果有误,则对出错审查项下的审查规则进行微调,并将微调结果同步到合同审查知识图谱,最终迭代出效果最佳的合同智能审查算法;S2

5、使用合同知识图谱同步模块,提取审查点、子审查项、风险提示文本、所涉及标签信息,生成审查清单。
[0008]优选的,所述S3中合同智能审查包括如下步骤:S3

1、用户上传合同,开始审查,同时文档解析模块将docx、PDF等格式的合同,解析为统一格式的合同文本信息;S3

2、要素抽取模块会先识别出合同中的基本信息,例如合同类型,签约各方信息,将这类信息展示给用户,辅助用户完善智能审查的必要信息,以及相应的审查清单的选择,例如“商铺租赁”类合同与“货物买卖”类合同的审查点是不一样的,而“货物买卖”类合同中,用户属于“买方”还是“卖方”所关注的审查重点也有不同,要素抽取模块可以辅助用
户快速选择合同审查中的必要信息、选择审查清单,以便继续后续审查步骤;S3

3、用户自主选择审查立场、审查点清单,继续后续智能审查步骤,随后算法调度模块根据审查清单、审查立场,筛选需要执行的审查模块,将这些模块组合成这次审查需要执行的审查模块执行树;并获取这些审查模块所需要的所有条款分类模型、要素抽取模型,依据标签体系说明的所有标签、要素之间的层级关系,生成这次审查需要执行的算法模型执行树,依照算法模型执行树以及审查模块执行树,依次调用所有模型以及审查模块;S3

4、审查模块,从条款分类模型、要素抽取模型的执行结果中,获取审查需要的条款信息以及要素信息,依据合同审查知识图谱中的信息,依次执行所有子审查项,根据子审查项的审查规则,判断是否存在风险,生成并返回所有审查结果;S3

5、将审查模块返回的结果,根据审查清单的配置,生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言理解的合同智能审查方法,其特征在于:所述审查方法包括如下步骤:S1、构建合同审查知识图谱:人工构建的标签体系以及审查点,共同构成合同审查知识图谱;S2、实现审查规则:算法工程师根据该知识图谱,实现具体的合同审查功能;S3、合同智能审查:合同审查之前,用户可以自行定制审查清单,每个合同类型所有的审查点,组合成该合同类型的默认审查清单,用户可以从默认审查清单中筛选出自己需要的审查点,并可以对审查点的审查点名称、子审查项名称、风险提示信息进行编辑,最终形成自己需要的审查清单,后续的智能审查功能,会依据每个审查清单所涉及到的审查点的不同,自动执行不同的审查操作。2.根据权利要求1所述的一种基于自然语言理解的合同智能审查方法,其特征在于:所述S1中构建合同审查知识图谱包括如下步骤:S1

1、梳理合同审查需求,将比较抽象的合同审查需求整合成有限的几个审查点,例如货物买卖合同中会有“合同金额审查”审查点;S1

2、将审查点包含的各类风险,整合为有限的几个子审查项,每个审查项审查具体的一个风险点,例“合同金额审查”审查点下会有“金额大小写一致性”,“总金额准确性”等几个子审查项;S1

3、根据审查点以及其子审查项,抽象出实现审查逻辑可能需要的标签,并确定标签内涵,并且随机选取一些真实合同,对上述标签进行试标注,确认在真实合同中,上述标签是否可用,内涵是否准确;S1

4、若在试标注过程中,发现某些标签设置不合理,或者内涵不准确,则重复上述两步,同时将标签以及其内涵迭代到算法可用、内涵明确的程度,将上述标签整合成有一定层级关系的标签体系,例如货物买卖合同中会有“支付”条款、“违约责任”条款,而“支付”条款下又有“货物总价”、“交付时间”等条款,将这些条款整理成一组有层级结构的标签;S1

5、根据构建的上述标签体系,以及标签内涵,标注一系列合同文本数据,并将标签体系以及标注数据同步给算法工程师,用以训练算法模型;S1

6、依据标签体系,形成审查点各子审查项的具体审查规则,例如
“‘
货物总价

标签中合同总金额,若不同时存在大写金额、小写金额、货币类型,则存在风险”;S1

7、所有审查点组成了合同审查知识图谱,图谱中包含所有标签、审查点、审查项、审查规则、风险提示信息等内容;S1

8、使用合同知识图谱同步模块将梳理好的知识图谱同步给算法工程师,用以实现审查点以及审查规则,同时根据合同智能审查实际效果,调整相关标签/审查规则等知识图谱信息,优化迭代合同审查知识图谱。3.根据权利要求1所述的一种基于自然语言理解的合同智能审查方法,其特征在于:所述S2中实现审查规则括如下步骤:S2

1、使用合同知识图谱同步模块,提取标签体系相关信息,基于标签体系,将标注数据按照标签的层级结构生成模型的训练数据;S2

2、基于上述标签体系,以及训练数据,训练算法模型,使得算法能够依据人工构建的标签体系,准确识别该类合同中的各类标签、要素;
S2

3、使用...

【专利技术属性】
技术研发人员:贾赀贺
申请(专利权)人:北京幂律智能科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1