一种智能识别并生成电子合同的方法及系统技术方案

技术编号：28321829 阅读：73 留言：0更新日期：2021-05-04 13:02

本发明专利技术涉及一种智能识别并生成电子合同的方法及系统，该方法包括：获取多层PDF、单层PDF或图片格式的电子合同文档，对电子合同文档进行文本信息的识别；调用表单域识别算法对待填充区域进行标记；对待填充区域进行待签署区域的识别，将待填充字段分为待签署区域和基础数据区域；建立基础数据的数据库，调用数据库对基础数据区域进行批量填充后生成各个电子合同；针对需要大批量签订合同的情况，考虑实际上企业通常掌握有员工的各种基本信息，通过智能的识别任意的PDF或图片格式的电子合同文件，生成可供批量填充操作的电子合同模板文件，完成合同准备工作进入后续签署流程，极大的提高了工作效率和从业人员使用体验，同时可以减少不必要的人工成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能识别并生成电子合同的方法及系统
本专利技术涉及信息
，尤其涉及一种智能识别并生成电子合同的方法及系统。
技术介绍
随着电子化和智能化应用越来越多的应用到生活工作场景中，电子合同已经逐渐取代纸质合同成为无纸化信息服务的必备条件。例如企业和员工之间经常需要签署劳务合同、劳务协议、派签协议以及实习协议等各种各样的合同，而且通常并非单个签署，经常需要批量签署，又因为签署的合同模板多种多样，又会经常需要更新调整，因此每次调整或新增都需要技术人员进行有针对性的调整修改合同模板，是一件非常耗时耗力又容易出错的工作。
技术实现思路
本专利技术针对现有技术中存在的技术问题，提供一种智能识别并生成电子合同的方法及系统，解决现有技术中重复类型合同签订耗时耗力的问题。本专利技术解决上述技术问题的技术方案如下：一种智能识别并生成电子合同的方法，包括：步骤1，获取多层PDF、单层PDF或图片格式的电子合同文档，对所述电子合同文档进行文本信息的识别；步骤2，调用表单域识别算法对待填充区域进...

【技术保护点】
1.一种智能识别并生成电子合同的方法，其特征在于，所述方法包括：/n步骤1，获取多层PDF、单层PDF或图片格式的电子合同文档，对所述电子合同文档进行文本信息的识别；/n步骤2，调用表单域识别算法对待填充区域进行标记；/n步骤3，对所述待填充区域进行待签署区域的识别，将待填充字段分为待签署区域和基础数据区域；/n步骤4，建立基础数据的数据库，调用所述数据库对所述基础数据区域进行批量填充后生成各个电子合同。/n

【技术特征摘要】
1.一种智能识别并生成电子合同的方法，其特征在于，所述方法包括：
步骤1，获取多层PDF、单层PDF或图片格式的电子合同文档，对所述电子合同文档进行文本信息的识别；
步骤2，调用表单域识别算法对待填充区域进行标记；
步骤3，对所述待填充区域进行待签署区域的识别，将待填充字段分为待签署区域和基础数据区域；
步骤4，建立基础数据的数据库，调用所述数据库对所述基础数据区域进行批量填充后生成各个电子合同。

2.根据权利要求1所述的方法，其特征在于，所述步骤1中获取的电子合同文档为多层PDF格式时，文本信息的识别的过程包括：调用PDF文本流操作接口，获取所有文字内容。

3.根据权利要求1所述的方法，其特征在于，所述步骤1中获取的电子合同文档为单层PDF或图片格式时，文本信息的识别的过程包括：
步骤101，对单层PDF或图片进行预处理，所述预处理包括去噪处理、红章识别处理以及角度调整中的一项或多项；
所述去噪处理的过程包括：获取单层PDF或图片的灰度直方图，根据所述灰度直方图检测出预设灰度值像素点成片状分布的部分并去除；
所述红章识别处理的过程包括：基于颜色和椭圆轮廓检测到所述单层PDF或图片包含红章时，对所述单层PDF或图片的红章轮廓内的区域进行白平衡处理，并去除红色分量；
所述角度调整的过程包括：对所述单层PDF或图片的内容进行直线识别，基于识别到的直线对所述所述单层PDF或图片进行角度调整；
步骤102，对预处理后的所述单层PDF或图片进行OCR图像识别，将图片信息转化为文本信息。

4.根据权利要求1所述的方法，其特征在于，所述步骤1之后还包括：调用自然语言处理算法，对所述文本...

【专利技术属性】
技术研发人员：游牧，
申请(专利权)人：武汉文楚智信科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人