一种合同规范性的审核方法、装置、设备和介质制造方法及图纸

技术编号:33438903 阅读:27 留言:0更新日期:2022-05-19 00:26
本发明专利技术提供一种合同规范性的审核方法、装置、设备和介质,方法包括:接收到合同审核指令,获取合同文件的格式信息;根据所述格式信息判断是否可按照相应的编码格式直接获取文字信息,若是,则直接读取文档内容,若否,则调用光学字符识别模型获取文档内容,形成全文内容文本;将所述全文内容文本与合同类型模板进行正交比对,确认合同所属的种类,并根据种类确认适用的审核模板;调用适用的审核模板,对所述全文内容文本进行模板比对审核。本发明专利技术可以通过不同的合同文件格式来综合匹配不同的方式以获取合同文件的内容文本并进行审核,而且既能小体量的光学字符识别模型,从而提升模型的识别速度,又能保证模型的识别效果。又能保证模型的识别效果。又能保证模型的识别效果。

【技术实现步骤摘要】
一种合同规范性的审核方法、装置、设备和介质


[0001]本专利技术涉及光学字符识别的
,特别涉及一种合同规范性的审核方法、装置、设备和介质。

技术介绍

[0002]合同是当事人或当事双方之间设立、变更、终止民事关系的协议。依法成立的合同,受法律保护,由于合同往往涉及较重大的利益,不同类型的合同均具有不同的重要条款必须明确,且重要条款还需规范表达,因此合同的规范性要求尤其重要,需要对合同作必要的审核。
[0003]由于目前的合同格式有多种,有的格式(如WORD格式)可以直接读取文本内容,因此审核比较方便,而有的合同是扫描件,无法直接读取文本内容,需借助光学字符识别技术(OCR)进行内容识别后再进行审核。目前没有统一的审核系统,而是需要在多种软件平台上进行,这种多个平台的切换操作导致审核效率较低。
[0004]另外,使用光学字符识别技术(OCR)进行识别时,需先将外部OCR识别模型从存储器上读取到内存上,再由处理器进行处理,但由于目前市面上使用的OCR识别模型普遍体量较大,从而导致模型读取时间长,影响效率。
专利技术内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合同规范性的审核方法,其特征在于:包括下述步骤:S1、接收到合同审核指令,获取合同文件的格式信息;S2、根据所述格式信息判断是否可按照相应的编码格式直接获取文字信息,若是,则直接读取文档内容,若否,则调用光学字符识别模型获取文档内容,形成全文内容文本;S3、将所述全文内容文本与合同类型模板进行正交比对,确认合同所属的种类,并根据种类确认适用的审核模板,所述审核模板包括一个或多个关键词、各关键词使用的空间条件以及各关键词的叙述规范;S4、调用适用的审核模板,对所述全文内容文本进行模板比对审核,具体是:将所述全文内容文本与各所述关键词进行一一比对,判断是否存在所述关键词;若否,则提示需添加相关项;若是,进一步判断关键词是否满足所述空间条件,若不满足,则提示对于该审核项需要清晰说明;若满足,则给出该合同涉及相关项且不违规的提示,并根据所述叙述规范进一步判断关键词叙述是否规范;若不规范,则直接提示不规范并显示规范要求;若规范,则提示合同符合规范。2.根据权利要求1所述的一种合同规范性的审核方法,其特征在于:所述光学字符识别模型为经过扫描合同数据集强化训练好的智能模型,所述光学字符识别模型获取文档内容的具体过程如下:(1)、通过预处理模型对合同文件进行预处理后并得到合同文件的预处理图片;(2)、将预处理图片输入到空间模型中,通过卷积、池化、激活函数提取空间潜层信息;所述空间模型在融合浅层信息和融合深层信息特征时,均是采用一层1*1卷积层和一层3*3或5*5的卷积层;(3)、将得到的空间潜层信息输入到时序模型中,通过多层双向SRN层提取时序潜层信息;(4)、根据时序潜层信息对输入的图片进行字符分类,得到全文内容文本。3.根据权利要求2所述的一种合同规范性的审核方法,其特征在于:所述空间模型的构成如下:第一层是卷积层,卷积核为5
×
5,步长为2
×
2,填充为2
×
2,通道数为24,激活函数为ReLU;第二层是卷积层,卷积核为3
×
3,步长为1
×
1,填充为1
×
1,通道数为24,激活函数为ReLU;第三层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为128;第四层是池化层,核为2,步长为2;第五层是卷积层,卷积核为3
×
3,步长为1
×
1,填充为1
×
1,通道数为128,归一化方法为BN,激活函数为ReLU;第六层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为256,归一化方法为BN;第七层是卷积层,卷积核为3
×
3或5
×
5,步长为1
×
1,填充为1
×
1,通道数为256,归一化方法为BN,激活函数为ReLU;第八层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为256;第九层是池化层,核为2
×
2,步长为2
×
1,填充为0
×
1;
第十层是卷积层,卷积核为3
×
3,步长为1
×
1,填充为1
×
1,通道数为256,归一化方法为BN,激活函数为ReLU;第十一层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为512,归一化方法为BN;第十二层是卷积层,卷积核为3
×
3或5
×
5,步长为1
×
1,填充为1
×
1,通道数为512,激活函数为ReLU;第十三层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为512;第十四层是池化层,核为2
×
2,步长为2
×
1,填充为0
×
1;第十五层是卷积层,卷积核为2
×
2,步长为1
×
1,填充为1
×
1,通道数为512,归一化方法为BN,激活函数为ReLU;第十六层是卷积层,卷积核为1
×
1,步长为1
×
1,通道数为512,归一化方法为BN。4.根据权利要求1所述的一种合同规范性的审核方法,其特征在于:所述时序模型的构成是:第一层为双向SRN层,节点数为256;第二层为全连接层,节点数为256:第三层为双向SRN层,节点数为256:第四层为全连接层,节点数为256。5.一种合同规范性的审核装置,其特征在于:包括:格式判断模块,用于在接收到合同审核指令后,获取合同文件的格式信息;文档内容获取模块,用于根...

【专利技术属性】
技术研发人员:黄家昌应佳良杨辉邱道椿
申请(专利权)人:福建亿能达信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1