一种不良资产经营领域合同版本自动化对比工具及方法技术

技术编号:23446244 阅读:81 留言:0更新日期:2020-02-28 20:18
本发明专利技术一种不良资产经营领域合同版本自动化对比工具及方法,对比工具包括:文档预处理模块、条款标题对比模块、段落审核模块、条款对比审核模块;方法如下:输入一个合同的两个版本文件;调用文档预处理模块分别将读入的两个合同版本文档进行分段;调用段落审核模块分别对两个文档的首页集合进行逐段对比;调用段落审核模块分别对两个合同文档的非条款段落集合进行逐段对比;调用条款标题对比审核模块对条款段落集合的每个条款的标题进行对比审核;记录该结果,命名为条款标题审核结果;调用条款对比审核模块对通过条款标题审核结果遍历条款段落集合。本发明专利技术提高了审核效率,节省了审核时间,解决了人工成本高、劳动密集且效率低下的业务痛点。

An automatic comparison tool and method of contract version in the field of non-performing assets management

【技术实现步骤摘要】
一种不良资产经营领域合同版本自动化对比工具及方法
本专利技术涉及一种不良资产经营领域合同版本自动化对比工具及方法,尤其涉及一种基于合同语义模型的不良资产经营领域合同版本自动化对比工具,涉及计算机信息处理与自然语言处理

技术介绍
不良资产经营领域是指对不良资产收购、管理、经营、处置等构成的商业活动。在对不良资产进行经营的过程中,往往会涉及到多方主体,牵扯到众多复杂的权利和义务。为了保证业务的顺利开展及各方权益不受损害,相关信息均会转化为相关合同条款记录于合同文档中。合同文档是不良资产经营领域中约束活动双方权利和义务的文件,它是保障业务流程能够得以顺利进行的重要环节,也是保护活动双方利益的有效工具。实际开展业务过程中,合同不可避免需要在双方甚至多方之间进行多次流转、修改、审阅等活动。在上述过程中,需要业务人员或法务人员对同一合同的不同版本进行审核,然后对不当之处进行修改并返还给上一环节的人员进行修正。该过程往往会持续发生多次才能够在合同内容中全面覆盖整个商业活动的相关权益。其中每次审核与对比均会耗费相关人员大量的时间和精力,且存在较大的操作性风险。随着自然语言处理技术的发展,程序已经能够代替人类进行纯机械式的劳动密集型工作,而合同版本之间的审核对比工作本质上同样是机械式的劳动密集型工作,因此,能够利用自然语言处理技术自动化完成该项工作,从而释放业务人员的精力和时间,专注于不良资产经营业务本身的开展和研究。此外,利用自然语言处理技术自动完成合同版本对比还能够减少操作性风险的发生。专
技术实现思路
基于以上存在于合同流转及审核过程中的问题,本专利技术提出了一种不良资产经营领域合同版本自动化对比工具及方法,是一种基于合同语义模型的合同版本对比工具。基于合同每次修订前后的版本文件,利用自然语言处理技术自动进行语义与字符串的比对工作。基于对比结果,利用前端技术以不同颜色将之高亮显示。根据审核结果,能够对对比结果进行接收与拒绝判断,从而解决了人工审核时存在的机械式工作以及降低了操作性风险的发生。为实现上述目的,本专利技术一种不良资产经营领域合同版本自动化对比工具及方法,采用如下之技术方案:本专利技术一种不良资产经营领域合同版本自动化对比方法,其流程如图1所示,整体流程如下:(1)输入一个合同的两个版本文件,开始审核流程。(2)调用文档预处理模块分别将读入的两个合同版本文档(上一个版本的合同文档以“模板”表示,下一个版本的合同文档以“审核文档”表示)进行分段,得到两个段落的有序集合,再分别将每一个集合分成三类:首页、非条款段落和条款段落集合。其中文档预处理模块是指:用于读入文档(如docx文档)并进行便于系统识别字符串处理的模块。(3)调用段落审核模块分别对两个文档的首页集合进行逐段对比,得到一个首页对比结果集合,使用这个首页对比结果集合去标注审核文档和模板文档。其中段落审核模块是指:用于经预处理模块处理的两个文档进行逐段对比并得到差异结果的模块。(4)调用段落审核模块分别对两个合同文档的非条款段落集合进行逐段对比,得到一个非条款段落结果对比结果集合,使用这个非条款段落结果对比集合去标注审核文档和模板文档。(5)调用条款标题对比审核模块对条款段落集合的每个条款的标题进行对比审核,将条款的标题分成三类:与模板一致、与模板不一致但与模板的某条一致、与模板不一致且与模板其他不一致。记录该结果,并且命名为条款标题审核结果。其中条款标题对比审核模块是指:通过进行两篇文档每个条款标题的相似度对比得到最相似标题的模块。(6)调用条款对比审核模块对通过条款标题审核结果遍历条款段落集合;其中条款对比审核模块是指:调用了条款标题对比审核模块和和段落审核的模块用于对比合同中的条款段落的模块。具体流程如下:(a)若两个文档的条款段落的标题一致,则调用段落审核模块直接对相应内容进行逐段对比,得到一个第一条款段落结果对比结果集合,使用这个第一条款段落结果对比集合去标注审核文档和模板文档;(b)若审核文档条款段落的标题与模板不一致但与模板的某条一致,则找到模板的相应条款段落,然后调用段落审核模块对该条款段落与模板文档的相应的条款段落,进行逐句对比,得到一个第二条款段落结果对比结果集合,使用这个第二条款段落结果对比集合去标注审核文档和模板文档;(c)若审核文档条款段落的标题与模板不一致且与模板其他不一致,则在审核文档中标注该条款段落为黄色,认为是用户完全修改了某一些段落。一种不良资产经营领域合同版本自动化对比工具,具体包括:文档预处理模块、条款标题对比模块、段落审核模块、条款对比审核模块;其中,条款对比审核模块为本工具的主调模块,条款标题对比模块与段落审核模块为此工具的核心模块。具体如下:文档预处理模块:该模块提供了两个版本的合同文档的导入。首先,判断导入的两个文档是否都为同一种类型文件(例如是否都为docx文件),然后,对于导入的文件进行分句操作,并将句子分词、去符号及语气词,随后将两个合同文档分别分为首页、非条款、条款三部分,每部分均为句子集合。其中,两个合同版本文档中,上一个版本的合同文档以“模板”表示,下一个版本的合同文档以“审核文档”表示;条款标题对比模块:输入两个文档的条款句子集合,以模板的条款标题为基础对审核文档的标题进行遍历扫描,得到三类结果:“不一致”,“某条一致”,“完全一致”,对于“不一致”的结果进行高亮显示;对于“某条一致”和“完全一致”的结果进行段落审核。其中具体的对比过程如下:首先基于正则匹配,确定是否有完全一致的标题,若有则可以获得判定结果。若无,则以历史合同的所有条款作为训练语料,计算每个词语的词向量。然后,获得每个标题句子的向量特征后,依次进行余弦值计算,根据阈值判断两个条款标题是否相似,若余弦值大于阈值则判断为相似,若余弦值小于阈值则判断为不相似。段落审核模块:对于两个文档的段落以句子为单位,进行依次逐句匹配,利用改进过的最长公共子序列的算法,获得两个句子的对应位置的差异字符串,分别以相同、修改、添加、删除四个差异字符串表示对比结果,若差异字符串为空,则表示两个句子完全一样。以差异字符串的位置为基准对文档条款的内容进行比对,并以四种颜色进行高亮显示,其中四种颜色及含义如下:条款对比审核模块:主调模块,主要提供外部调用,并且连接文档预处理模块、条款标题对比模块、段落审核模块。具体为接收文档预处理模块的结果,调用条款标题对比模块,并得到条款标题对比的对比结果,利用条款标题对比的对比结果,找到“模板文档”与“审核文档”每个对应的段落对,循环调用段落审核模块处理这些段落对,得到每个段落对的差异结果,最后利用这些差异结果,以不同颜色的高亮标注文档。本专利技术一种不良资产经营领域合同版本自动化对比工具及方法,与现有技术相比,其优点及功效在于:(1)相对于传统的合同版本对比手段,利用自然语言处理技术能够对合同文档进行自动审核对比,提高了审核效率,节省了审核时间,解决了人工成本高、劳动密集且效率低下的业务痛点。(本文档来自技高网
...

【技术保护点】
1.一种不良资产经营领域合同版本自动化对比方法,其特征在于:该方法步骤如下:/n(1)输入一个合同的两个版本文件,开始审核流程;/n(2)调用文档预处理模块分别将读入的两个合同版本文档进行分段;得到两个段落的有序集合,再分别将每一个集合分成三类:首页、非条款段落和条款段落集合;其中所述的两个合同版本文档,一个版本以“模板”表示,另一个版本以“审核文档”表示;/n(3)调用段落审核模块分别对两个文档的首页集合进行逐段对比,得到一个首页对比结果集合,使用这个首页对比结果集合去标注审核文档和模板文档;/n(4)调用段落审核模块分别对两个合同文档的非条款段落集合进行逐段对比,得到一个非条款段落结果对比结果集合,使用这个非条款段落结果对比集合去标注审核文档和模板文档;/n(5)调用条款标题对比审核模块对条款段落集合的每个条款的标题进行对比审核,将条款的标题分成三类:与模板一致、与模板不一致但与模板的某条一致、与模板不一致且与模板其他不一致;记录该结果,并且命名为条款标题审核结果;/n(6)调用条款对比审核模块对通过条款标题审核结果遍历条款段落集合。/n

【技术特征摘要】
1.一种不良资产经营领域合同版本自动化对比方法,其特征在于:该方法步骤如下:
(1)输入一个合同的两个版本文件,开始审核流程;
(2)调用文档预处理模块分别将读入的两个合同版本文档进行分段;得到两个段落的有序集合,再分别将每一个集合分成三类:首页、非条款段落和条款段落集合;其中所述的两个合同版本文档,一个版本以“模板”表示,另一个版本以“审核文档”表示;
(3)调用段落审核模块分别对两个文档的首页集合进行逐段对比,得到一个首页对比结果集合,使用这个首页对比结果集合去标注审核文档和模板文档;
(4)调用段落审核模块分别对两个合同文档的非条款段落集合进行逐段对比,得到一个非条款段落结果对比结果集合,使用这个非条款段落结果对比集合去标注审核文档和模板文档;
(5)调用条款标题对比审核模块对条款段落集合的每个条款的标题进行对比审核,将条款的标题分成三类:与模板一致、与模板不一致但与模板的某条一致、与模板不一致且与模板其他不一致;记录该结果,并且命名为条款标题审核结果;
(6)调用条款对比审核模块对通过条款标题审核结果遍历条款段落集合。


2.根据权利要求1所述的一种不良资产经营领域合同版本自动化对比方法,其特征在于:所述的文档预处理模块用于读入文档并进行便于系统识别字符串处理。


3.根据权利要求1所述的一种不良资产经营领域合同版本自动化对比方法,其特征在于:所述的段落审核模块用于经预处理模块处理的两个文档进行逐段对比并得到差异结果。


4.根据权利要求1所述的一种不良资产经营领域合同版本自动化对比方法,其特征在于:所述的条款标题对比审核模块通过进行两篇文档每个条款标题的相似度对比得到最相似标题。

【专利技术属性】
技术研发人员:尹昌蒋泽晟仵伟强周金黄其他发明人请求不公开姓名
申请(专利权)人:华融融通北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1