合同风险预测方法和装置制造方法及图纸

技术编号:30242472 阅读:14 留言:0更新日期:2021-10-09 20:21
公开了一种合同风险预测方法和装置。获取从合同文本中提取的合同内部元素。获取与合同当事方有关的合同外部元素。将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果。合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。由此,能够基于合同文本内部信息和合同文本外部的企业信息,对合同文本中潜在的风险进行预测。对合同文本中潜在的风险进行预测。对合同文本中潜在的风险进行预测。

【技术实现步骤摘要】
合同风险预测方法和装置


[0001]本公开涉及一种风险预测领域,特别涉及合同风险预测领域。

技术介绍

[0002]合同签署之后,往往会因为一些原因导致合同未能成功履行,或者双方在合同履行过程中产生纠纷而导致法律诉讼。因此,在最终签署合同之前对潜在的合同风险进行提示是很有必要的。
[0003]一般而言,合同风险有内部风险和外部风险两大类因素。
[0004]所谓内部风险,是指合同文档本身存在的问题导致的风险。所谓外部风险,则涉及公司资质、公司经营状况、公司法律风险等合同文档外部的因素导致的风险。
[0005]目前的合同审查技术主要集中在内部风险审查。例如,主要通过字段抽取、一致性比对等自然语言处理(NLP)的规则或者算法,对合同文档本身进行形式审查和实质审查。
[0006]另一方面,外部风险审查更多地是对签署合同的对方公司的尽职调查,包括公司资质审查、公司经营状况审查、公司法律风险审查等等。
[0007]然而,对于有些风险,单纯进行合同文本的内部风险审查,或者单独进行外部风险审查,都不可能发现。例如,如果合同文档内部提供的公司法人信息和从外部信息获取的公司法人信息不匹配,那么这就是一个风险点。而这个风险不论是通过单纯的内部风险审查还是单纯的外部风险审查,都不能够发现。
[0008]因此,还需要一种能够结合内部风险审查和外部风险审查的合同风险预测方案。

技术实现思路

[0009]本公开要解决的一个技术问题是提供一种合同风险预测方法和装置,其能够结合合同内部信息和合同外部的企业信息来对合同风险进行预测。
[0010]根据本公开的第一个方面,提供了一种合同风险预测方法,包括:获取从合同文本中提取的合同内部元素;获取与合同当事方有关的合同外部元素;以及将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果,其中,合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。
[0011]可选地,第一注意力模块基于注意力机制执行下述操作:将多个合同内部元素转化为对应的多个第一向量;组合多个第一向量得到第一矩阵;以及对第一矩阵进行卷积操作和池化操作,得到第一特征向量。可选地,第二注意力模块基于注意力机制执行下述操作:将多个合同外部元素转化为对应的多个第二向量;组合多个第二向量得到第二矩阵;以及对第二矩阵进行卷积操作和池化操作,得到第二特征向量。
[0012]可选地,合同风险预测模型还包括:交互注意力模块,基于交互注意力机制,结合
第一矩阵和第二矩阵,得到用于第一注意力模块的第一权重向量和用于第二注意力模块的第二权重向量,其中,第一注意力模块根据第一权重向量对卷积结果进行池化操作得到第一特征向量,第二注意力模块根据第二权重向量对卷积结果进行池化操作得到第二特征向量。
[0013]可选地,第一注意力模块以多个第一向量分别为行向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为列向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第一矩阵与第二矩阵相乘,得到第三矩阵,对第三矩阵按行求和得到第一权重向量,对第三矩阵按列求和得到第二权重向量。或者,可选地,第一注意力模块以多个第一向量分别为列向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为行向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第二矩阵与第一矩阵相乘,得到第三矩阵,对第三矩阵按列求和得到第一权重向量,对第三矩阵按行求和得到第二权重向量。
[0014]可选地,第一权重向量的多个元素分别为多个第一向量对应的权重;并且第二权重向量的多个元素分别为多个第二向量对应的权重。
[0015]可选地,第一向量是合同内部元素的向量表示;并且/或者第二向量是合同外部元素的向量表示;并且/或者卷积操作为宽卷积操作;并且/或者池化操作为基于注意力的平均池化操作。
[0016]可选地,分类模块包括softmax层。
[0017]可选地,合同外部元素包括合同当事方的信息和/或合同当事方的关联方的信息。
[0018]可选地,合同外部元素包括通过数据授权和/或通过爬虫方式获得的合同当事方和/或关联方的信息;并且/或者合同外部元素包括合同当事方和/或关联方的下述至少一项信息:基本信息、法律诉讼相关数据、经营状况、经营风险、知识产权。
[0019]可选地,每一方的信息分别作为一个合同外部元素。
[0020]可选地,基于合同当事方和关联方的关联关系,以合同当事方为顶节点,关联方为邻节点,构成图结构,第二注意力模块基于图注意力机制对合同外部元素进行处理,得到相应的第二特征向量。
[0021]可选地,第二注意力模块基于自注意力机制,将合同当事方的信息汇总到顶节点上;并且/或者第二注意力模块基于掩码注意力机制,仅考虑合同当事方的直接关联方,将合同当事方的直接关联方的信息汇总到顶节点的一级邻节点上。
[0022]可选地,第二注意力模块基于自注意力机制,计算顶节点的注意力权重;并且/或者第二注意力模块基于掩码注意力机制,计算顶节点的一级邻节点注意力权重。
[0023]可选地,合同内部元素包括合同基本信息和/或合同内部风险特征;并且/或者合同内部元素包括人工从合同文本中抽取的元素和/或通过自然语言处理从合同文本中抽取的元素。
[0024]可选地,该方法还可以包括:使用已正常履约的合同文本和未正常履约的合同文本为训练样本,对合同风险预测模型进行训练。
[0025]可选地,合同风险预测模型用于预测合同后期被终止的风险,以先前被终止的合同文本为正样本,以正常履约完成的合同文本作为负样本。
[0026]可选地,合同风险预测模型用于预测合同后期发生法律诉讼的风险,以先前发生
合同法律纠纷的合同为正样本,以正常履约完成未发生合同法律纠纷的合同作为负样本。
[0027]可选地,该方法还可以包括:从法院裁判文书网获取合同法律纠纷的裁判文书;从裁判文书中解析得到合同信息;以及基于合同信息获取对应的合同文本,作为正样本。
[0028]根据本公开的第二个方面,提供了一种合同风险预测模型训练方法,包括:获取未正常履约的合同文本,作为正样本;获取正常履约的合同文本,作为负样本;以及使用正样本和负样本对合同风险预测模型进行训练。合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。...

【技术保护点】

【技术特征摘要】
1.一种合同风险预测方法,包括:获取从合同文本中提取的合同内部元素;获取与合同当事方有关的合同外部元素;以及将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果,其中,合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到所述合同风险预测结果。2.根据权利要求1所述的方法,其中,第一注意力模块基于注意力机制执行下述操作:将多个合同内部元素转化为对应的多个第一向量;组合多个第一向量得到第一矩阵;以及对第一矩阵进行卷积操作和池化操作,得到第一特征向量,并且/或者,第二注意力模块基于注意力机制执行下述操作:将多个合同外部元素转化为对应的多个第二向量;组合多个第二向量得到第二矩阵;以及对第二矩阵进行卷积操作和池化操作,得到第二特征向量。3.根据权利要求2所述的方法,其中,所述合同风险预测模型还包括:交互注意力模块,基于交互注意力机制,结合第一矩阵和第二矩阵,得到用于第一注意力模块的第一权重向量和用于第二注意力模块的第二权重向量,其中,第一注意力模块根据第一权重向量对卷积结果进行池化操作得到第一特征向量,第二注意力模块根据第二权重向量对卷积结果进行池化操作得到第二特征向量。4.根据权利要求3所述的方法,其中,第一注意力模块以多个第一向量分别为行向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为列向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第一矩阵与第二矩阵相乘,得到第三矩阵,对第三矩阵按行求和得到第一权重向量,对第三矩阵按列求和得到第二权重向量,或者,第一注意力模块以多个第一向量分别为列向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为行向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第二矩阵与第一矩阵相乘,得到第三矩阵,对第三矩阵按列求和得到第一权重向量,对第三矩阵按行求和得到第二权重向量。
5.根据权利要求3所述的方法,其中,第一权重向量的多个元素分别为多个第一向量对应的权重;并且第二权重向量的多个元素分别为多个第二向量对应的权重。6.根据权利要求2所述的方法,其中,第一向量是合同内部元素的向量表示;并且/或者第二向量是合同外部元素的向量表示;并且/或者所述卷积操作为宽卷积操作;并且/或者所述池化操作为基于注意力的平均池化操作。7.根据权利要求1所述的方法,其中,所述分类模块包括softmax层。8.根据权利要求1所述的方法,其中,合同外部元素包括合同当事方的信息和/或合同当事方的关联方的信息。9.根据权利要求8所述的方法,其中,合同外部元素包括通过数据授权和/或通过爬虫方式获得的合同当事方和/或关联方的信息;并且/或者合同外部元素包括合同当事方和/或关联方的下述至少一项信息:基本信息、法律诉讼相关数据、经营状况、经营风险、知识产权。10.根据权利要求8所述的方法,其中,每一方的信息分别作为一个合同外部元素。11.根据权利要求8所述的方法,其中,基于合同当事方和关联方的关联关...

【专利技术属性】
技术研发人员:李旭瑞李红松刘晓钟宋红叶蓝金炯孙常龙张琼
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1