一种合同文本风险检测方法、装置、设备及存储介质制造方法及图纸

技术编号:21432429 阅读:119 留言:0更新日期:2019-06-22 11:59
本发明专利技术公开了一种合同文本风险检测方法、装置、设备及存储介质,涉及自然语言处理和语义计算等领域,所述方法包括:根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型;利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型;对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。本发明专利技术实施例通过基于大量合同文本训练得到的分类模块和深度语义匹配模型,实现对待检测合同文本的风险检测,对客户进行风险提醒,不需要提取特定词语或短语以及人工设定规则,提高了合同文本解析和风险判决准确率。

【技术实现步骤摘要】
一种合同文本风险检测方法、装置、设备及存储介质
本专利技术涉及自然语言处理和语义计算等领域,特别涉及一种合同文本风险检测方法、装置、设备及存储介质。
技术介绍
近年来,随着合同文本的规范化以及自然语言处理的进步,一些公司利用自然语言技术对商业合同进行自动解析,其中商业合同的部分基础工作可以通过机器预先处理,从而减少人力,提高效率。现有技术主要通过人工或半自动方式选择一些特定词语或短语作为特征,然后利用预设规则或机器学习算法对合同文本进行解析,从而完成文书解析裁判的工作。对于该类方案,需要人工提取特征词语,以及用预设规则来完成法律文书的检测,或者通过计算两个法律文书的关键词的相似度来计算两个文书之间的相似度。由于中文表达的多样性特点,上述方案无法对合同文本进行准确地解析和风险判决。
技术实现思路
本专利技术实施例提供的一种合同文本风险检测方法、装置、设备及存储介质,解决合同文本解析和风险判决不准确的问题。根据本专利技术实施例提供的一种合同文本风险检测方法,包括:根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型;利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型;对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。优选地,还包括:在根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型之前,构建用于对合同文本的条款进行分类的条款分类模型;利用所述商业领域的训练合同文本,对所构建的条款分类模型进行训练,得到性能优化的条款分类模型。优选地,所述利用所述商业领域的训练合同文本,对所构建的条款分类模型进行训练,得到性能优化的条款分类模型包括:对所述训练合同文本的条款进行分类,得到所述训练合同文本的条款文本及对应的条款类型;对所述训练合同文本的条款文本进行分词处理,得到组成所述训练合同文本的条款文本的词语;利用所述词语的词向量及对应的条款类型,对所述条款分类模型的参数进行调整,得到性能优化的条款分类模型。优选地,还包括:在利用所述条款分类模型,对所述合同文本的条款进行分类之后,若每个预设条款类型均有对应的条款文本,则确定所述合同文本完备。优选地,所述对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度包括:利用语义匹配模型,将每个所述条款类型的条款文本与所述条款类型的条款样本进行相似比对,得到条款文本相似度;根据所述条款文本相似度与预设风险阈值,对所述合同文本进行风险评估,得到每个所述条款类型的条款文本的风险程度。优选地,所述利用语义匹配模型,将每个所述条款类型的条款文本与所述条款类型的条款样本进行相似比对,得到条款文本相似度包括:从样本数据库中获取所述条款类型对应的多个条款样本;利用所述语义匹配模型,将组成所述条款文本的词语的词向量分别与组成每个所述条款样本的词语的词向量进行相似比对,得到所述条款文本与每个所述条款样本的相似度,并将最大相似度确定为所述条款类型的条款文本相似度。优选地,还包括:在确定每个所述条款类型的条款文本的风险程度之后,将每个所述条款类型的条款文本作为新样本,保存至所述样本数据库;利用所述样本数据库的所述新样本,更新所述条款分类模块和所述语义匹配模型。根据本专利技术实施例提供的一种合同文本风险检测装置,包括:模型获取模块,用于根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型;条款分类模块,用于利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型;风险评估模块,用于对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。根据本专利技术实施例提供的一种合同文本风险检测设备,包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的合同文本风险检测程序,所述合同文本风险检测程序被所述处理器执行时实现上述的合同文本风险检测方法的步骤。根据本专利技术实施例提供的存储介质,其上存储有合同文本风险检测程序,所述合同文本风险检测程序被处理器执行时实现上述的合同文本风险检测方法的步骤。本专利技术实施例提供的技术方案具有如下有益效果:本专利技术实施例通过基于大量合同文本训练得到的分类模块和深度语义匹配模型,实现对待检测合同文本的风险检测,对客户进行风险提醒,不需要提取特定词语或短语以及人工设定规则,提高了合同文本解析和风险判决准确率。附图说明图1是本专利技术实施例提供的合同文本风险检测流程图;图2是本专利技术实施例提供的合同文本风险检测装置框图;图3是本专利技术实施例提供的合同文本风险检测系统架构图;图4是本专利技术实施例提供的完备性检测模块流程图;图5是本专利技术实施例提供的风险检测模块流程图;图6是本专利技术实施例提供的自学习模块流程图。具体实施方式以下结合附图对本专利技术的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1是本专利技术实施例提供的合同文本风险检测流程图,如图1所示,步骤包括:步骤S101:根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型。在步骤S101之前,还包括:构建用于对合同文本的条款进行分类的条款分类模型,利用所述商业领域的训练合同文本,对所构建的条款分类模型进行训练,得到性能优化的条款分类模型。具体训练时,对所述训练合同文本的条款进行分类,得到所述训练合同文本的条款文本及对应的条款类型,对所述训练合同文本的条款文本进行分词处理,得到组成所述训练合同文本的条款文本的词语,利用所述词语的词向量及对应的条款类型,对所述条款分类模型的参数进行调整,得到性能优化的条款分类模型。步骤S102:利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型。利用步骤S102的分类结果,可以对所述合同文本进行完备性检测,具体地说,若每个预设条款类型均有对应的条款文本,则确定所述合同文本完备。步骤S103:对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。步骤S103包括:利用语义匹配模型,将每个所述条款类型的条款文本与所述条款类型的条款样本进行相似比对,得到条款文本相似度,根据所述条款文本相似度与预设风险阈值,对所述合同文本进行风险评估,得到每个所述条款类型的条款文本的风险程度。更具体地,可以从样本数据库中获取所述条款类型对应的多个条款样本,然后利用所述语义匹配模型,将组成所述条款文本的词语的词向量分别与组成每个所述条款样本的词语的词向量进行相似比对,得到所述条款文本与每个所述条款样本的相似度,并将最大相似度确定为所述条款类型的条款文本相似度。在步骤S103之后,还包括:将每个所述条款类型的条款文本作为新样本,保存至所述样本数据库,以便利用所述样本数据库的所述新样本,更新所述条款分类模块和所述语义匹配模型。进一步地,在保存样本之前,还可以先根据步骤S103的处理结果,生成风险报告,并发送至客户端,以供客户端的法律人士进行确认鉴定,然后根据客户端的确认鉴定结果,保存样本。其中,人工鉴定时,确认该合同文本的条款文本是否确实具有高风险度或低风险度。如果确认条款文本具有高本文档来自技高网...

【技术保护点】
1.一种合同文本风险检测方法,其特征在于,包括:根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型;利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型;对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。

【技术特征摘要】
1.一种合同文本风险检测方法,其特征在于,包括:根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型;利用所述条款分类模型,对所述合同文本的条款进行分类,得到所述合同文本的条款文本及对应的条款类型;对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度。2.根据权利要求1所述的方法,其特征在于,还包括:在根据待检测的合同文本所属商业领域,获取所述商业领域对应的条款分类模型之前,构建用于对合同文本的条款进行分类的条款分类模型;利用所述商业领域的训练合同文本,对所构建的条款分类模型进行训练,得到性能优化的条款分类模型。3.根据权利要求2所述的方法,其特征在于,所述利用所述商业领域的训练合同文本,对所构建的条款分类模型进行训练,得到性能优化的条款分类模型包括:对所述训练合同文本的条款进行分类,得到所述训练合同文本的条款文本及对应的条款类型;对所述训练合同文本的条款文本进行分词处理,得到组成所述训练合同文本的条款文本的词语;利用所述词语的词向量及对应的条款类型,对所述条款分类模型的参数进行调整,得到性能优化的条款分类模型。4.根据权利要求3所述的方法,其特征在于,还包括:在利用所述条款分类模型,对所述合同文本的条款进行分类之后,若每个预设条款类型均有对应的条款文本,则确定所述合同文本完备。5.根据权利要求3或4所述的方法,其特征在于,所述对每个所述条款类型的条款文本进行风险评估,确定每个所述条款类型的条款文本的风险程度包括:利用语义匹配模型,将每个所述条款类型的条款文本与所述条款类型的条款样本进行相似比对,得到条款文本相似度;根据所述条款文本相似度与预设风险阈值,对所述合同文本进行风险评估...

【专利技术属性】
技术研发人员:许慢牛国扬陈虹温海娇邓钊
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1