一种OCR系统中采用深度学习矫正发票图片分割结果的方法技术方案

技术编号：21362574 阅读：25 留言：0更新日期：2019-06-15 09:35

本发明专利技术公开了一种OCR系统中采用深度学习矫正发票图片分割结果的方法一种OCR系统中采用深度学习矫正发票图片分割结果的方法包括1：获取训练图片，并提取训练生成矫正模型；步骤2：搜集票据图片的第一属性和第二属性，然后再提取截取的非发票的图片或被截取的残缺的发票图片标记为负样本，不记录其第二属性信息；步骤3：构建矫正网络对步骤1和2所得的图片通过神经网络进行处理，运用常用的人脸检测常用数据集运用得出的模型进行迁移训练；步骤4：对步骤3所得票据图片进行初步切图，并获取的第三属性和第四属性结合票据图片输入步骤1所得的矫正模型得到修正后的第三属性和第四属性，即得到最终的票据图片分割结果。

A Method of Correcting Invoice Picture Segmentation Results by Deep Learning in OCR System

The invention discloses a method for correcting the segmentation result of invoice pictures by deep learning in OCR system. A method for correcting the segmentation result of invoice pictures by deep learning in OCR system includes: 1. acquiring training pictures and extracting training to generate correction model; 2. collecting the first and second attributes of bill pictures, and then extracting intercepted non-invoice pictures or intercepted pictures. The incomplete invoice pictures are marked as negative samples without recording their second attribute information; Step 3: Construct a correction network to process the pictures obtained in steps 1 and 2 through neural networks, and use the models obtained from commonly used face detection data sets for migration training; Step 4: Preliminary cut the bill pictures obtained in step 3, and obtain the third attribute and the fourth attribute. The third and fourth attributes are obtained by combining the attributes with the correction model obtained in step 1 of the bill image input, that is, the final bill image segmentation result.

全部详细技术资料下载

【技术实现步骤摘要】
一种OCR系统中采用深度学习矫正发票图片分割结果的方法
本专利技术涉及液晶电视
，具体的说，是一种OCR系统中采用深度学习矫正发票图片分割结果的方法。
技术介绍
在做发票核算、票面信息录入等批量业务OCR时，往往都是一张发票粘贴在一张A4纸张上，而票面OCR仅仅关注票据的主体部分，非发票主体部分空白边缘会对OCR处理时的计算资源造成浪费。所以就需要首先对A4纸进行分割。自动分割发票技术虽已应用，但由于发票图片的一些特殊性，难以和背景底色准确区分，所以分割后仍需对分割后的结果进行坐标纠正，以满足OCR处理需求。由于人工矫正很难统一标准，且批量矫正的工作量大，造成业务处理效率低下。
技术实现思路
本专利技术的目的在于提供一种OCR系统中采用深度学习矫正发票图片分割结果的方法，用于解决现有技术中做发票核算、票面信息录入等批量业务OCR时发票图片难以和背景底色准确区分，而人工矫正很难统一标准，且批量矫正的工作量大，造成业务处理效率低下的问题。本专利技术通过下述技术方案解决上述问题：一种OCR系统中采用深度学习矫正发票图片分割结果的方法，所述方法包括如下步骤：步骤1：获取训练图片，并提取其第一属性和第二属性进行训练，根据第一属性和第二属性返回训练图片取得正负样本标签，联合训练图片、第一属性和第二属性共同以生成矫正模型；步骤2：搜集票据图片的第一属性和第二属性，联合扫描件发票图片提取训练的正样本图片，然后再提取截取的非发票的图片或被截取的残缺的发票图片标记为负样本，不记录其第二属性信息；步骤3：构建矫正网络对步骤1和2所得的图片通过神经网络进行处理，运用常用的人脸检...

【技术保护点】
1.一种OCR系统中采用深度学习矫正发票图片分割结果的方法，其特征在于，所述方法包括如下步骤：步骤1：获取训练图片，并提取其第一属性和第二属性进行训练，根据第一属性和第二属性返回训练图片取得正负样本标签，联合训练图片、第一属性和第二属性共同以生成矫正模型；步骤2：搜集票据图片的第一属性和第二属性，联合扫描件发票图片提取训练的正样本图片，然后再提取截取的非发票的图片或被截取的残缺的发票图片标记为负样本，不记录其第二属性信息；步骤3：构建矫正网络对步骤1和2所得的图片通过神经网络进行处理，运用常用的人脸检测常用数据集运用得出的模型进行迁移训练；步骤4：对步骤3所得票据图片进行初步切图，并获取的第三属性和第四属性结合票据图片输入步骤1所得的矫正模型得到修正后的第三属性和第四属性，即得到最终的票据图片分割结果。

【技术特征摘要】
1.一种OCR系统中采用深度学习矫正发票图片分割结果的方法，其特征在于，所述方法包括如下步骤：步骤1：获取训练图片，并提取其第一属性和第二属性进行训练，根据第一属性和第二属性返回训练图片取得正负样本标签，联合训练图片、第一属性和第二属性共同以生成矫正模型；步骤2：搜集票据图片的第一属性和第二属性，联合扫描件发票图片提取训练的正样本图片，然后再提取截取的非发票的图片或被截取的残缺的发票图片标记为负样本，不记录其第二属性信息；步骤3：构建矫正网络对步骤1和2所得的图片通过神经网络进行处理，运用常用的人脸检测常用数据集运用得出的模型进行迁移训练；步骤4：对步骤3所得票据图片进行初步切图，并获取的第三属性和第四属性结合票据图片输入步骤1所得的矫正模型得到修正后的第三属性和第四属性，即得到最终的票据图片分割结果。2.根据权利要求1所述的一种OCR系统中采用深度学习矫正发票图片分割结果的方法，其特征在于：所述第一属性包括切出主体...

【专利技术属性】
技术研发人员：梁欢，肖欣庭，池明辉，赵冬，
申请(专利权)人：四川长虹电器股份有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人