一种坐标预测模型生成方法、装置及图形识别方法、装置制造方法及图纸

技术编号:27806360 阅读:87 留言:0更新日期:2021-03-30 09:20
一种坐标预测模型生成方法、装置及图形识别方法、装置,包括:利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型;其中,训练样本集包括:多张包含待识别图形的样本图像以及每个待识别图形的实际顶点坐标。由于采用了大量训练样本训练深度卷积神经网络模型,因此生成的坐标预测模型是一个稳定的模型,从而保证了后续图像中图形的识别准确度。而保证了后续图像中图形的识别准确度。而保证了后续图像中图形的识别准确度。

【技术实现步骤摘要】
一种坐标预测模型生成方法、装置及图形识别方法、装置


[0001]本文涉及图像处理技术,尤指一种坐标预测模型生成方法、装置及图形识别方法、装置。

技术介绍

[0002]随着科技的发展,很多业务需要通过计算机技术对图像中的图形进行识别,例如从一张图像中识别出文档、PPT或者证件。
[0003]相关技术中,图像中图形的获取基于传统计算机视觉CV边缘检测算法。
[0004]然而,这种算法的抗干扰能力较差,极易受到外界干扰(例如在背景与图形边缘区分不明显),因此无法保证后续图像中图形的识别准确度。

技术实现思路

[0005]本申请提供了一种坐标预测模型生成方法、装置及图形识别方法、装置,能够提供一个稳定的坐标预测模型,从而保证后续图像中图形的识别准确度。
[0006]本申请提供了一种坐标预测模型生成方法,包括:
[0007]利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型;其中,所述训练样本集包括:多张包含待识别图形的样本图像以及每个所述待识别图形的实际顶点坐标。
[0008]所述图形包括:四边形。
[0009]所述利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型,包括:
[0010]将所述训练样本集作为所述深度卷积神经网络模型的输入,根据预先设定的损失函数,利用反向传播算法对所述深度卷积神经网络模型进行迭代训练、调整所述深度卷积神经网络模型的参数,直到损失函数的损失值收敛,得到所述坐标预测模型。
[0011]所述损失函数包括:用于计算预测顶点坐标与实际顶点坐标之间绝对误差的第一损失函数。
[0012]所述训练样本集还包括:用于表示来自每张所述样本图像的实际坐标构成的图形为所述待识别图形的标识信息;
[0013]所述损失函数包括:通过第一损失函数与第一权重因子,第二损失函数与第二权重因子进行加权运算得到的第三损失函数;其中,所述第一损失函数用于计算预测顶点坐标与实际顶点坐标之间的绝对误差,所述第二损失函数用于判断预测顶点坐标构成的图形是否是所述待识别图形,所述第一权重因子和所述第二权重因子的和为1。
[0014]所述第一权重因子和所述第二权重因子均为0.5。
[0015]本申请还提供了一种图形识别方法,包括:
[0016]获取包含目标图形的待处理图像;
[0017]将所述待处理图像输入至如上述任一项所述的坐标预测模型生成方法生成的坐
标预测模型,得到所述目标图形的预测顶点坐标,并基于所述预测顶点坐标识别所述目标图形。
[0018]所述图像包括:静态图像和动态图像;
[0019]当所述图像为动态图像时,针对组成所述动态图像的每一帧静态图像,所述得到目标图形的预测顶点坐标之后,以及基于预测顶点坐标识别目标图形之前,还包括:
[0020]将获得的预测顶点坐标输入预先设置的滤波器,得到经过处理的预测顶点坐标。
[0021]所述滤波器的层数为两层。
[0022]本申请还提供了一种坐标预测模型生成装置,包括:
[0023]第一处理模块,用于利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型;其中,所述训练样本集包括:多张包含待识别图形的样本图像以及每个所述待识别图形的实际顶点坐标。
[0024]本申请还提供了一种图形识别装置,包括:
[0025]获取模块,用于获取包含目标图形的待处理图像;
[0026]第二处理模块,用于将所述待处理图像输入至如上述所述的坐标预测模型生成装置生成的坐标预测模型,得到所述目标图形的预测顶点坐标,并基于所述预测顶点坐标识别所述目标图形。
[0027]与相关技术相比,本申请包括:利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型;其中,所述训练样本集包括:多张包含待识别图形的样本图像以及每个所述待识别图形的实际顶点坐标。由于采用了大量训练样本训练深度卷积神经网络模型,因此生成的坐标预测模型是一个稳定的模型,从而保证了后续图像中图形的识别准确度。
[0028]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0029]附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0030]图1为本申请实施例提供的一种坐标预测模型生成方法的流程示意图;
[0031]图2为本申请实施例提供的识别出的图形的示意图;
[0032]图3为本申请实施例提供的坐标预测模型生成装置的结构示意图;
[0033]图4为本申请实施例提供的图形识别装置的结构示意图。
具体实施方式
[0034]本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结
合使用,或可以替代任何其它实施例中的任何其他特征或元件。
[0035]本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的专利技术方案。任何实施例的任何特征或元件也可以与来自其它专利技术方案的特征或元件组合,以形成另一个由权利要求限定的独特的专利技术方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
[0036]此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
[0037]本申请实施例提供一种坐标预测模型生成方法,如图1所示,包括:
[0038]步骤101、利用训练样本集迭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种坐标预测模型生成方法,其特征在于,包括:利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型;其中,所述训练样本集包括:多张包含待识别图形的样本图像以及每个所述待识别图形的实际顶点坐标。2.根据权利要求1所述的方法,其特征在于,所述图形包括:四边形。3.根据权利要求1或2所述的方法,其特征在于,所述利用训练样本集迭代训练预先构建的深度卷积神经网络模型,生成用于预测图像中图形的顶点坐标的坐标预测模型,包括:将所述训练样本集作为所述深度卷积神经网络模型的输入,根据预先设定的损失函数,利用反向传播算法对所述深度卷积神经网络模型进行迭代训练、调整所述深度卷积神经网络模型的参数,直到损失函数的损失值收敛,得到所述坐标预测模型。4.根据权利要求3所述的方法,其特征在于,所述损失函数包括:用于计算预测顶点坐标与实际顶点坐标之间绝对误差的第一损失函数。5.根据权利要求3所述的方法,其特征在于,所述训练样本集还包括:用于表示来自每张所述样本图像的实际坐标构成的图形为所述待识别图形的标识信息;所述损失函数包括:通过第一损失函数与第一权重因子,第二损失函数与第二权重因子进行加权运算得到的第三损失函数;其中,所述第一损失函数用于计算预测顶点坐标与实际顶点坐标之间的绝对误差,所述第二损失函数用于判断预测顶点坐标构成的图形是否是所述待识别图形,所述第一权重因子和所述第二权重...

【专利技术属性】
技术研发人员:熊龙飞段纪伟郑辉胡旭华
申请(专利权)人:珠海金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1