自动合同审查方法、装置、介质以及电子设备制造方法及图纸

技术编号:21833259 阅读:16 留言:0更新日期:2019-08-10 18:13
本公开是关于一种自动合同审查方法、装置、介质以及电子设备,属于机器学习应用技术领域,该方法包括:接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。本公开利用合同主要特征要素训练机器学习模型,实现自动对合同文本段的审查,有效提高了审查的效率和准确率。

Automatic contract review methods, devices, media and electronic equipment

【技术实现步骤摘要】
自动合同审查方法、装置、介质以及电子设备
本公开涉及机器学习应用
,具体而言,涉及一种自动合同审查方法及装置。
技术介绍
合同审查是指对各种合同、协议、履约凭证、函件等法律文件进行审查,进行合同审查时,通常对合同文件内的所有内容根据法律法规和规章制度进行判断是否违规等,例如,文件内容是否符合有关法律法规和监管规定,相关权利义务约定是否明确合理;公司的权益是否得到充分的保护,是否存在不利于公司权益的问题;文件涉及的法律要素是否齐全,是否违反有关法律法规的禁止性规定,是否符合相关监管规定。目前,对合同的审核主要是人工进行,对文本中的每一段根据审查员的知识积累,审查经验进行判断分析,需要花费大量的时间,不仅效率低,而且容易受到各种外界因素的影响;所以一种可以自动对合同中的文本段进行审查的方法和装置意义重大,可以有效提高审查的准确率和效率,降低审核人员的工作负荷。因此,需要提供一种自动合同审查方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种自动合同审查方案,进而至少在一定程度上在减少审查人员的工作负荷的情况下,自动、准确、高效的实现合同的审核。根据本公开的一个方面,提供一种自动合同审查方法,包括:接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。在本公开的一种示例性实施例中,所述获取所述目标类别的合同的文本,包括:获取目标类别的合同的扫描图像;利用光学字符识别从所述扫描图像中识别出所述目标类别的合同的文本。在本公开的一种示例性实施例中,所述定位到所述合同的文本中多个一级标题和各一级标题下的子标题,包括:获取目标类别的合同的合同模板,所述合同模板含有一级标题的位置信息和各一级标题下的各子标题位置信息;利用多个所述一级标题的位置信息,定位合同的文本中的所述多个一级标题;根据所述多个一级标题的定位结果和各一级标题下各子标题位置信息,定位所述合同的文本中各一级标题下的各子标题。在本公开的一种示例性实施例中,所述根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段,包括:利用所述子标题位置信息指向的位置后的第一个空位符和空位符后的第一个句号,获取该空位符和空位符后的第一个句号之间的第一文本段;利用所述空位符后的第一个句号和在该第一个句号之后的第二个句号,获取所述第一个句号和第二个句号之间的第二文本段,直到到达该子标题的下一个子标题位置信息指向的位置。在本公开的一种示例性实施例中,所述机器学习模型的训练方法是:收集事先标定了审查结果的合同的类别、一级标题、子标题和文本段样本组集;将所述合同的类别、一级标题、子标题和文本段样本组的数据输入机器学习模型,由机器学习模型输出所述样本组对应的审查结果;如果所述输出的审查结果与对所述样本组事先标定的审查结果不一致,则调整机器学习模型的系数,直到所述输出的审查结果与对所述样本组事先标定的审查结果一致;当机器学习模型针对所有样本组输出的审查结果与事先标定的审查结果一致,训练结束。在本公开的一种示例性实施例中,根据每种类别的合同分别训练适用于每种类别的合同的机器学习模型,其特征在于,在所述根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段之后,所述方法包括:根据所述目标类别的合同的类别,查找所述类别对应的机器学习模型;将目标类别的合同的一级标题、子标题和文本段的作为输入数据输入所述类别对应的机器学习模型,得到所述文本段的审查结果。在本公开的一种示例性实施例中,根据多种类别的合同训练一个适用于多种类别的合同的机器学习模型,其特征在于,在所述根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段之后,所述方法包括:将合同的类别、一级标题、子标题和文本段的作为输入数据输入所述适用于多种类别的合同的机器学习模型,得到所述文本段的审查结果。根据本公开的一个方面,提供一种自动合同审查装置,其特征在于,包括:第一获取模块,用于接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位模块,用于定位到所述合同的文本中多个一级标题和各一级标题下的子标题;第二获取模块,用于根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;审查模块,用于将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有自动合同审查程序,其特征在于,所述自动合同审查程序被处理器执行时实现上述任一项所述的方法。根据本公开的一个方面,提供一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的自动合同审查程序;其中,所述处理器配置为经由执行所述自动合同审查程序来执行上述任一项所述的方法。本公开一种自动合同审查方法及装置,首先,接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;在接收到合同审查指令时,需要自动获取合同的文本在后续步骤中用来审查;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;通过定位合同文本中的个标题可以有效将合同文本分节,同时各级标题分别代表了一个包含标题的小节的主题,可以在后续步骤中结合标题进行有效合理的审查;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;通常文本中的正文是包含在各标题下,这样可以准确的结合标题爬取到各段文本;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果;通过训练机器学习模型,实现自动对合同文本段的审查,有效提高了审查的效率和准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出一种自动合同审查方法的流程图。图2示意性示出一种自动合同审查方法的应用场景示例图。图3示意性示出一种多个一级标题和各一级标题下的子标题的定位方法流程图。图4示意性示出一种自动合同审查装置的方框图。图5示意性示出一种用于实现上述自动合同审查方法的电子设备示例框图。图6示意性示出一种用于实现上述自动合同审查方法的计算机可读存储介质。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结本文档来自技高网...

【技术保护点】
1.一种自动合同审查方法,其特征在于,包括:接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。

【技术特征摘要】
1.一种自动合同审查方法,其特征在于,包括:接收到目标类别的合同的审查指令,获取所述目标类别的合同的文本;定位到所述合同的文本中多个一级标题和各一级标题下的子标题;根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段;将所述合同的类别、一级标题、子标题和文本段的作为输入数据输入预先训练好的机器学习模型,得到所述文本段的审查结果。2.根据权利要求1所述的方法,其特征在于,所述获取所述目标类别的合同的文本,包括:获取目标类别的合同的扫描图像;利用光学字符识别从所述扫描图像中识别出所述目标类别的合同的文本。3.根据权利要求1所述的方法,其特征在于,所述定位到所述合同的文本中多个一级标题和各一级标题下的子标题,包括:获取目标类别的合同的合同模板,所述合同模板含有一级标题的位置信息和各一级标题下的各子标题位置信息;利用多个所述一级标题的位置信息,定位合同的文本中的所述多个一级标题;根据所述多个一级标题的定位结果和各一级标题下各子标题位置信息,定位所述合同的文本中各一级标题下的各子标题。4.根据权利要求1所述的方法,其特征在于,所述根据所述定位到的一级标题和各一级标题下的子标题,依次获取所述子标题下的文本段,包括:利用所述子标题位置信息指向的位置后的第一个空位符和空位符后的第一个句号,获取该空位符和空位符后的第一个句号之间的第一文本段;利用所述空位符后的第一个句号和在该第一个句号之后的第二个句号,获取所述第一个句号和第二个句号之间的第二文本段,直到到达该子标题的下一个子标题位置信息指向的位置。5.根据权利要求1所述的方法,其特征在于,所述机器学习模型的训练方法是:收集事先标定了审查结果的合同的类别、一级标题、子标题和文本段样本组集;将所述合同的类别、一级标题、子标题和文本段样本组的数据输入机器学习模型,由机器学习模型输出所述样本组对应的审查结果;如果所述输出的审查结果与对所述样本组事先标定的...

【专利技术属性】
技术研发人员:鄢真刘建刘玉强金明李雯叶素兰
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1