文档图像的处理方法、装置、介质、设备及模型训练方法制造方法及图纸

技术编号：35680412 阅读：22 留言：0更新日期：2022-11-23 14:22

本公开涉及一种文档图像的处理方法、装置、介质、设备及模型训练方法，该处理方法包括：通过色调饱和值彩色模型对文档图像进行图像分割，生成三通道空间图像，对文档图像的背景区域进行过滤，生成二值边缘图像，将三通道空间图像和二值边缘图像进行拼接融合，生成目标输入数据，根据图像翻转识别模型对目标输入数据进行翻转识别，确定文档图像的目标翻转类别，根据目标翻转类别，对文档图像进行反向翻转得到目标图像。从而通过图像翻转识别模型对文档图像中的文字特征进行识别，并根据翻转角度对文档图像进行翻转，使上传的文档图像不会受到拍摄角度的干扰，用户能够直观的查看文档图像中的信息。图像中的信息。图像中的信息。

全部详细技术资料下载

【技术实现步骤摘要】
文档图像的处理方法、装置、介质、设备及模型训练方法

[0001]本公开涉及图像处理领域，具体地，涉及一种文档图像的处理方法、装置、介质、设备及模型训练方法。

技术介绍

[0002]在现有的网络教育场景中，教师和学生经常使用手机、平板电脑等拍照设备对书籍、试卷、作业本等教学素材进行拍照上传，用于后续的作业提交，笔记归档等。但在实际操作中，因拍照时的角度不规范，导致上传图像的角度出现翻转，对后续针对上传图像进行作业批改、整理归档等带来困扰。

技术实现思路

[0003]为克服相关技术中存在的问题，本公开提供一种文档图像的处理方法、装置、介质、设备及模型训练方法，用于解决因拍照角度不规范，导致上传图像翻转，不方便查看的技术问题。
[0004]根据本公开实施例的第一方面，提供一种文档图像的处理方法，包括：
[0005]通过色调饱和值彩色模型对所述文档图像进行图像分割，生成三通道空间图像；
[0006]对所述文档图像的背景区域进行过滤，生成二值边缘图像；
[0007]将所述三通道空间图像和所述二值边缘图像进行拼接融合，生成目标输入数据；
[0008]根据图像翻转识别模型对所述目标输入数据进行翻转识别，确定所述文档图像的目标翻转类别；
[0009]根据所述目标翻转类别，对所述文档图像进行反向翻转得到目标图像。
[0010]可选地，所述图像翻转识别模型包括特征提取网络和卷积神经网络，所述根据图像翻转识别模型对所述目标输入数据进行翻转识别，确定所述文档图像的目标翻...

【技术保护点】

【技术特征摘要】
1.一种文档图像的处理方法，其特征在于，包括：通过色调饱和值彩色模型对所述文档图像进行图像分割，生成三通道空间图像；对所述文档图像的背景区域进行过滤，生成二值边缘图像；将所述三通道空间图像和所述二值边缘图像进行拼接融合，生成目标输入数据；根据图像翻转识别模型对所述目标输入数据进行翻转识别，确定所述文档图像的目标翻转类别；根据所述目标翻转类别，对所述文档图像进行反向翻转得到目标图像。2.根据权利要求1所述的处理方法，其特征在于，所述图像翻转识别模型包括特征提取网络和卷积神经网络，所述根据图像翻转识别模型对所述目标输入数据进行翻转识别，确定所述文档图像的目标翻转类别，包括：通过所述特征提取网络对所述目标输入数据进行特征提取，生成三维特征图像；根据所述卷积神经网络获取所述三维特征图像分属于多个图像翻转类别的置信度评分，以确定置信度评分最高的图像翻转类别为目标翻转类别。3.根据权利要求2所述的处理方法，其特征在于，所述通过所述特征提取网络对所述目标输入数据进行特征提取，生成三维特征图像，包括：根据所述特征提取网络识别所述目标输入数据的文字尺寸；根据所述文字尺寸确定所述特征提取网络的首层卷积核和次层卷积核；基于所述首层卷积核和所述次层卷积核对所述输入数据进行特征提取，生成所述三维特征图像。4.根据权利要求2所述的处理方法，其特征在于，所述根据所述卷积神经网络获取所述三维特征图像分属于多个图像翻转类别的置信度评分，以确定置信度评分最高的图像翻转类别为目标翻转类别，包括：根据所述卷积神经网络对所述三维特征图进行降维，生成一维特征向量；将所述一维特征向量与预设全连接网络进行链接，生成分属于多个图像翻转类别的多个置信度评分，其中，所述预设全连接网络根据所述多个图像翻转类别进行设定；将所述多个置信度评分进行比较，确定置信度评分最高的图像翻转类别为所述目标翻转类别。5.根据权利要求4所述的处理方法，其特征在于，所述将所述一维特征向量与预设全连接网络进行链接，生成分属于多个图像翻转类别的多个置信度评分，包括：根据所述预设全连接网络对所述一维特征向量进行分类，生成所述多个图像翻转类别；对所述多个图像翻转类别进行置信度计算，生成所述多个置信度评分。6.一种图像翻转识别模型的训练方法，其特征在于，应用于上述权利要求1
‑
5中任一项所述图像翻转识别模型，所述方法包括：根据随机裁切算法对样本图像进行裁切，生成预设第一数量的裁切子图像；基于所述裁切子图像中是否包含文字信息，对所述裁切子图像进行筛选，获得有效图像，其中所述有效图像中包含文字信息；根据预设翻转规则将所述有效图像进行镜像翻转，生成翻转图像和预设翻转标签；通过所述图像翻转识别模型对所述翻转图像进行识别，确定目标翻转标签；
在所述目标翻转标签与所述预...

【专利技术属性】
技术研发人员：王彦君，
申请(专利权)人：北京鼎事兴教育咨询有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人