文本检测方法及文本检测网络训练方法技术

技术编号:31502029 阅读:14 留言:0更新日期:2021-12-22 23:21
本申请涉及一种文本检测方法及文本检测网络训练方法。所述文本检测方法包括:获取文本图像;对文本图像进行目标检测,得到与文本图像对应的目标建议框;根据目标建议框进行特征提取与上下文关系构建,得到目标建议框的上下文聚合特征,上下文聚合特征用于表征目标建议框之间的关系;根据上下文聚合特征,对目标建议框进行分类,确定与分类结果对应的文本检测框;基于文本检测框对文本图像进行文本检测,得到文本检测结果。采用本方法能够提高文本检测准确度。本检测准确度。本检测准确度。

【技术实现步骤摘要】
文本检测方法及文本检测网络训练方法


[0001]本申请涉及人工智能
,特别是涉及一种文本检测方法及文本检测网络训练方法。

技术介绍

[0002]随着人工智能技术的发展,出现了自然场景文本检测技术,自然场景文本检测技术是指对自然场景中出现的文本进行检测,其在日常生活中有着极其广泛的应用,例如,可应用于智能问答、文本

图片检索和高精度地图导航等中。
[0003]传统技术中,常采用基于回归的方法和基于分割的方法进行自然场景文本检测,其中,基于回归的方法通过设计具有文本形状先验信息的文本建议框生成方法以提高文本检测性能,基于分割的方法主要通过对文本区域进行像素级别的预测实现文本检测。
[0004]然而,传统方法,基于回归的方法,仅仅针对文本的形状特征进行设计,且需要将文本区域分解成独立单字预测再连接,存在检测准确度低的问题,基于分割的方法,由于图像的像素之间具有独立性和低相关性,也会存在检测准确度低的问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高文本检测准确度的文本检测方法、装置、计算机设备和存储介质及文本检测网络训练方法、装置、计算机设备和存储介质。
[0006]一种文本检测方法,所述方法包括:
[0007]获取文本图像;
[0008]对文本图像进行目标检测,得到与文本图像对应的目标建议框;
[0009]根据目标建议框进行特征提取与上下文关系构建,得到目标建议框的上下文聚合特征,上下文聚合特征用于表征目标建议框之间的关系;
[0010]根据上下文聚合特征,对目标建议框进行分类,确定与分类结果对应的文本检测框;
[0011]基于文本检测框对文本图像进行文本检测,得到文本检测结果。
[0012]一种文本检测装置,所述装置包括:
[0013]获取模块,用于获取文本图像;
[0014]目标检测模块,用于对文本图像进行目标检测,得到与文本图像对应的目标建议框;
[0015]特征提取模块,用于根据目标建议框进行特征提取与上下文关系构建,得到目标建议框的上下文聚合特征,上下文聚合特征用于表征目标建议框之间的关系;
[0016]分类模块,用于根据上下文聚合特征,对目标建议框进行分类,确定与分类结果对应的文本检测框;
[0017]文本检测模块,用于基于文本检测框对文本图像进行文本检测,得到文本检测结
果。
[0018]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0019]获取文本图像;
[0020]对文本图像进行目标检测,得到与文本图像对应的目标建议框;
[0021]根据目标建议框进行特征提取与上下文关系构建,得到目标建议框的上下文聚合特征,上下文聚合特征用于表征目标建议框之间的关系;
[0022]根据上下文聚合特征,对目标建议框进行分类,确定与分类结果对应的文本检测框;
[0023]基于文本检测框对文本图像进行文本检测,得到文本检测结果。
[0024]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0025]获取文本图像;
[0026]对文本图像进行目标检测,得到与文本图像对应的目标建议框;
[0027]根据目标建议框进行特征提取与上下文关系构建,得到目标建议框的上下文聚合特征,上下文聚合特征用于表征目标建议框之间的关系;
[0028]根据上下文聚合特征,对目标建议框进行分类,确定与分类结果对应的文本检测框;
[0029]基于文本检测框对文本图像进行文本检测,得到文本检测结果。
[0030]一种文本检测网络训练方法,包括:
[0031]获取初始文本检测网络以及携带检测框标注的样本图像,初始文本检测网络包括目标建议框生成网络、文本上下文关系网络以及文本检测框提取网络,检测框标注包括检测框位置和检测框类型;
[0032]通过目标建议框生成网络对样本图像进行目标检测,得到与样本图像对应的样本建议框;
[0033]通过文本上下文关系网络,根据样本建议框进行特征提取与上下文关系构建,得到样本建议框的样本上下文聚合特征;
[0034]通过文本检测提取网络,根据样本上下文聚合特征,对样本建议框进行分类,得到样本建议框的预测建议框类别;
[0035]比对样本建议框和检测框位置,以及预测建议框类别和检测框类型,得到模型损失函数;
[0036]根据模型损失函数调整初始文本检测网络,得到已训练的文本检测网络。
[0037]一种文本检测网络训练装置,包括:
[0038]样本获取模块,用于获取初始文本检测网络以及携带检测框标注的样本图像,初始文本检测网络包括目标建议框生成网络、文本上下文关系网络以及文本检测框提取网络,检测框标注包括检测框位置和检测框类型;
[0039]样本目标检测模块,用于通过目标建议框生成网络对样本图像进行目标检测,得到与样本图像对应的样本建议框;
[0040]样本特征提取模块,用于通过文本上下文关系网络,根据样本建议框进行特征提
取与上下文关系构建,得到样本建议框的样本上下文聚合特征;
[0041]样本文本检测模块,用于通过文本检测提取网络,根据样本上下文聚合特征,对样本建议框进行分类,得到样本建议框的预测建议框类别;
[0042]比对模块,用于比对样本建议框和检测框位置,以及预测建议框类别和检测框类型,得到模型损失函数;
[0043]调整模块,用于根据模型损失函数调整初始文本检测网络,得到已训练的文本检测网络。
[0044]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0045]获取初始文本检测网络以及携带检测框标注的样本图像,初始文本检测网络包括目标建议框生成网络、文本上下文关系网络以及文本检测框提取网络,检测框标注包括检测框位置和检测框类型;
[0046]通过目标建议框生成网络对样本图像进行目标检测,得到与样本图像对应的样本建议框;
[0047]通过文本上下文关系网络,根据样本建议框进行特征提取与上下文关系构建,得到样本建议框的样本上下文聚合特征;
[0048]通过文本检测提取网络,根据样本上下文聚合特征,对样本建议框进行分类,得到样本建议框的预测建议框类别;
[0049]比对样本建议框和检测框位置,以及预测建议框类别和检测框类型,得到模型损失函数;
[0050]根据模型损失函数调整初始文本检测网络,得到已训练的文本检测网络。
[0051]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0052]获取初始文本检测网络以及携带检测框标注的样本图像,初始文本检测网络包括目标建议本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法,其特征在于,所述方法包括:获取文本图像;对所述文本图像进行目标检测,得到与所述文本图像对应的目标建议框;根据所述目标建议框进行特征提取与上下文关系构建,得到所述目标建议框的上下文聚合特征,所述上下文聚合特征用于表征所述目标建议框之间的关系;根据所述上下文聚合特征,对所述目标建议框进行分类,确定与分类结果对应的文本检测框;基于所述文本检测框对所述文本图像进行文本检测,得到文本检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述文本图像进行目标检测,得到与所述文本图像对应的目标建议框包括:对所述文本图像进行特征提取,得到文本图像特征图;对所述文本图像特征图进行采样,得到采样特征图;根据所述采样特征图进行场景目标检测,得到与所述文本图像对应的目标建议框。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标建议框进行特征提取与上下文关系构建,得到所述目标建议框的上下文聚合特征包括:根据所述目标建议框以及采样特征图进行特征提取,得到与所述目标建议框对应的建议框特征集合;根据所述建议框特征集合,进行上下文关系构建,得到所述目标建议框的上下文聚合特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标建议框以及采样特征图进行特征提取,得到与所述目标建议框对应的建议框特征集合包括:获取所述目标建议框的建议框参数以及所述文本图像的图像尺寸;根据所述建议框参数,从所述采样特征图中确定与所述目标建议框对应的目标采样特征图;确定所述目标采样特征图中与所述目标建议框对应的特征区域,对所述特征区域进行区域特征聚集,得到外观特征,并比对所述建议框参数和所述图像尺寸,得到几何特征;根据所述外观特征和所述几何特征,得到混合特征;归集所述外观特征、所述几何特征以及所述混合特征,得到建议框特征集合。5.根据权利要求3所述的方法,其特征在于,所述根据所述建议框特征集合,进行上下文关系构建,得到所述目标建议框的上下文聚合特征包括:根据所述建议框特征集合中建议框特征进行图构建,得到与所述建议框特征对应的建议框特征图;分别对所述建议框特征图进行图卷积,得到与所述建议框特征图对应的特征数据;根据所述与所述建议框特征图对应的特征数据,得到所述目标建议框的上下文聚合特征。6.根据权利要求5所述的方法,其特征在于,所述根据所述建议框特征集合中建议框特征进行图构建,得到与所述建议框特征对应的建议框特征图包括:根据所述建议框特征,确定...

【专利技术属性】
技术研发人员:刘皓
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1