【技术实现步骤摘要】
图片纠正方法、装置、设备和可读存储介质
[0001]本专利技术涉及图像检测
,具体涉及一种图片纠正方法、装置、设备和可读存储介质。
技术介绍
[0002]通常,企业在收录人员个人信息时,需要个人将证件以图片形式上传至系统中,对接收到的证件图片进行扫描识别获得相关的个人信息。然而,由于个人拍摄角度或上传方式的不同,证件图片并不总是以标准正向角度(0度)放置,没有贴合人的常规视觉感受,增加了对证件图片的识别时间,且影响后续对证件信息的识别结果。因此,企业需要一种证件图片方向纠正技术来获得标准正向的证件图片,进而提高证件信息的识别准确率。
[0003]基于此,现有技术是通过人工操作的方式来纠正证件图片方向,通过人眼观察,若发现证件图片不符合标准方向,便使用手动旋转的方式将证件图片调整至标准方向,然而,专利技术人研究发现:当需要纠正的证件图片过多时,采用人工纠正的方式十分耗时,效率低下,且增加人工成本。
[0004]针对现有技术中人工纠正证件图片方向效率低的技术问题,目前未存在有效的解决办法。
专利技术 ...
【技术保护点】
【技术特征摘要】
1.一种图片纠正方法,其特征在于,所述方法包括:获取待纠正图片;对所述待纠正图片进行分割,生成多个子单元图片;将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签,统计输出的每个子单元图片的方向标签所属类别,将类别数量最多的方向标签作为所述待纠正图片的目标方向标签;根据所述目标方向标签对所述待纠正图片进行纠正操作,生成标准正向图片。2.根据权利要求1所述的方法,其特征在于,在所述将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签之前,所述方法还包括:获取第一训练集,其中,所述第一训练集由标准正向图片构成;确定所述标准正向图片的尺寸,判断所述标准正向图片的尺寸是否符合预设标准尺寸,若不符合,则将所述标准正向图片调整至预设标准尺寸;对调整后的标准正向图片进行等比例分割,生成多个尺寸相同的子单元图片,并为每个子单元图片添加0度方向标签,将带有0度方向标签的子单元图片作为第二训练集;将所述第二训练集中的所有子单元图片分别以相同旋转方向旋转90度、旋转180度和旋转270度,并将旋转角度作为每个子单元图片的方向标签,将旋转后带有方向标签的子单元图片作为第三训练集;将所述第二训练集和所述第三训练集中的子单元图片输入初始学习模型进行训练,得到图片方向识别模型。3.根据权利要求2所述的方法,其特征在于,所述初始学习模型通过如下训练方式得到图片方向识别模型:通过所述初始学习模型的第一卷积神经网络分别判断输入的所述第二训练集和所述第三训练集中的子单元图片中文本信息的权重,若所述子单元图片中文本信息的权重大于第一预设阈值,则将所述子单元图片作为第一卷积神经网络的输出;将所述初始学习模型的第一卷积神经网络输出的子单元图片输入至所述初始学习模型的第二卷积神经网络中,通过所述初始学习模型的第二卷积神经网络对输入的子单元图片带有的方向标签进行识别,并输出各子单元图片的方向标签;比对所述初始学习模型的第二卷积神经网络输出的各子单元图片的方向标签与所述第二训练集和所述第三训练集中的子单元图片的方向标签,判断所述初始学习模型的第二卷积神经网络的正确率是否大于第二预设阈值;在所述初始学习模型的第二卷积神经网络的正确率大于第二预设阈值时,则确定所述初始学习模型训练完成,将训练好的初始学习模型作为图片方向识别模型。4.根据权利要求1所述的方法,其特征在于,所述将多个所述子单元图片输入预先训练完成的图片方向识别模型中,获得所述图片方向识别模型输出的每个子单元图片的方向标签,统计输出的每个子单元图片的方向标签所属类别,将类别数量最多的方向标签作为所述待纠正图片的目标方向标签,包括:通过所述图片方向识别模型的第一卷积神经网络的卷积层和池化层接收各个子单元图片,输出各个子单元图片对应的第一特征矩阵和第二特征矩阵;
通过所述图片方向识别模型的第一卷积神经网络的第一全连接层接收所述第一特征矩阵和第二特征矩阵,并计算第一全连接层中的第一类别向量分别与所述第一特征矩阵和第二特征矩阵的乘积,输出所述各个子单元图片文字信息权重的概率得分;将文本信息权重的概率得分大于预设阈值的子单元图片输入图片方向识别模型的第二卷积神经网络的卷积层和池化层,输出各个...
【专利技术属性】
技术研发人员:蔡壮壮,林大权,徐亮,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。