一种合同条款的识别方法、装置、设备及介质制造方法及图纸

技术编号:33837538 阅读:38 留言:0更新日期:2022-06-16 11:56
本发明专利技术实施例公开了一种合同条款的识别方法、装置、设备及介质。所述合同条款的识别方法,包括:获取合同文本,以及与待识别的合同条款匹配的至少一个标准问;将各标准问分别与合同文本进行组合,得到多个输入数据;分别将各输入数据输入至完成训练的阅读理解模型中,获取各标准问在合同文本中的答案标注位置;根据各答案标注位置,形成与各标准问分别对应的标准答案,并将各标准问与匹配的标准答案进行组合,形成与合同文本匹配的合同条款识别结果。本发明专利技术实施例的技术方案能够大大降低对标注样本的需求,提升多变合同数据识别环境下的数据识别准确率。据识别准确率。据识别准确率。

【技术实现步骤摘要】
一种合同条款的识别方法、装置、设备及介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种合同条款的识别方法、装置、设备及介质。

技术介绍

[0002]合同条款的识别是数据处理
应用非常广泛的一个技术要点,合同条款的识别效率直接影响数据处理时长。
[0003]目前,一般利用关键词匹配的方法识别合同条款,但是利用关键词匹配的方法需要人工维护一个较大的关键词库,也无法对未出现过的关键词进行识别,而利用多层注意力机制的实体抽取方法进行合同条款识别时,虽然不再依赖关键词匹配,但依然是无法将实体识别成没有见过的类别。例如,若训练数据中只涉及了“甲方名称”和“乙方名称”,模型不可能在遇到“丙方名称”的时候完成正确归类。

技术实现思路

[0004]本专利技术实施例提供一种合同条款的识别方法、装置、设备及介质,能够大大降低对标注样本的需求,提升多变合同数据识别环境下的数据识别准确率。
[0005]第一方面,本专利技术实施例提供了一种合同条款的识别方法,包括:
[0006]获取合同文本,以及与待识别的合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种合同条款的识别方法,其特征在于,包括:获取合同文本,以及与待识别的合同条款匹配的至少一个标准问;将各标准问分别与合同文本进行组合,得到多个输入数据;分别将各输入数据输入至完成训练的阅读理解模型中,获取各标准问在合同文本中的答案标注位置;根据各答案标注位置,形成与各标准问分别对应的标准答案,并将各标准问与匹配的标准答案进行组合,形成与合同文本匹配的合同条款识别结果。2.根据权利要求1所述的方法,其特征在于,在分别将各输入数据输入至完成训练的阅读理解模型中之前,还包括:获取预训练模型,并将所述预训练模型与提示学习模型进行拼接,形成待训练模型;其中,所述预训练模型使用设定数量的中文阅读理解数据训练得到;使用训练样本集对所述待训练模型进行模型训练,并在训练过程中对所述提示学习模型中的模型参数进行调整,以形成所述阅读理解模型。3.根据权利要求2所述的方法,其特征在于,使用训练样本集对所述待训练模型进行模型训练,包括:依次获取至少一个训练样本,所述训练样本中包括:问题、文本以及问题答案在所述文本中的标注结果;分别将所述问题和文本进行分词处理以及整数格式转换,得到与所述问题和所述文本分别对应的整型输入数据;将各所述整型输入数据顺序输入至所述提示学习模型以及所述预训练模型中,获取与各所述整型输入数据分别对应的输出词向量;将各所述输出词向量输入至全连接层中,获取答案起始位置描述向量和答案结尾位置描述向量;将所述答案起始位置描述向量和答案结尾位置描述向量分别输入至分类网络中,获取答案起始位置概率集合,以及答案结尾位置概率集合;根据所述答案起始位置概率集合、答案结尾位置概率集合以及问题答案在所述文本中的标注结果,计算与所述待训练模型对应的损失函数;根据损失函数计算结果,对所述提示学习模型中的模型参数进行调整后,返回执行依次获取一个训练样本的操作,直至满足结束训练条件。4.根据权利要求3所述的方法,其特征在于,所述根据损失函数计算结果,对所述提示学习模型中的模型参数进行调整,包括:根据所述损失函数计算结果计算初始梯度,以及输出扰动向量;根据所述输出扰动向量以及所述初始梯度计算对抗梯度;根据所述对抗梯度对待训练模型进行对抗训练。5.根据权利要求1所述的方法,其特征在于,分别将各输入数据输入至完成训练的阅读理解模型中,获取各标准问在合同文本中的答案标注位置,包括:获取当前输入的目标输...

【专利技术属性】
技术研发人员:周正茂张健纪达麒陈运文
申请(专利权)人:达而观信息科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1