当前位置: 首页 > 专利查询>鹏城实验室专利>正文

文字区域边界检测方法、设备、存储介质及装置制造方法及图纸

技术编号:27817915 阅读:16 留言:0更新日期:2021-03-30 10:22
本发明专利技术公开了一种文字区域边界检测方法、设备、存储介质及装置,相较于现有的只通过探究任意形状文字的表达形式或增强特征表达进行场景文字检测的方式,本发明专利技术中,通过预设主干网络对待处理图像进行特征提取,获得图像特征,根据图像特征以及预设区域建议网络确定初始候选区域,并对初始候选区域进行池化处理,获得第一固定特征和第二固定特征,通过预设文字区域调整网络对第一固定特征进行分析,获得特征分析结果,根据预设文字掩码分割网络、第二固定特征以及特征分析结果确定目标文字区域边界检测结果,克服了现有技术中无法精确识别任意形状文字的区域边界的缺陷,从而能够优化文字的区域边界检测过程,提高文字区域边界检测的准确性。检测的准确性。检测的准确性。

【技术实现步骤摘要】
文字区域边界检测方法、设备、存储介质及装置


[0001]本专利技术涉及图像识别
,尤其涉及一种文字区域边界检测方法、设备、存储介质及装置。

技术介绍

[0002]现有技术为实现任意形状场景文字的检测,通常致力于探究任意形状文字的表达形式,例如,如何更好地学习像素点或文字片段的属性及之间的关系以区分文字区域,或者是致力于增强特征表达,例如,结合不同粒度的特征或者学习上下文特征等。
[0003]但是,现有技术中无法精确识别任意形状文字的区域边界,从而导致任意形状场景文字的检测准确率低、可靠性差。
[0004]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0005]本专利技术的主要目的在于提供一种文字区域边界检测方法、设备、存储介质及装置,旨在解决如何优化文字的区域边界检测过程的技术问题。
[0006]为实现上述目的,本专利技术提供一种文字区域边界检测方法,所述文字区域边界检测方法包括以下步骤:获取待处理图像,并通过预设主干网络对所述待处理图像进行特征提取,获得图像特征;根据所述图像特征以及预设区域建议网络确定初始候选区域,并对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征;通过预设文字区域调整网络对所述第一固定特征进行分析,获得特征分析结果;根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果;根据所述特征分析结果对所述初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果。
[0007]优选地,所述根据所述特征分析结果对所述初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果的步骤,具体包括:从所述特征分析结果中获取置信度和位置偏移,并根据所述初始文字区域边界以及所述位置偏移确定初始文字掩码;根据所述初始文字掩码确定文字掩码重叠率,并根据所述文字掩码重叠率以及所述置信度确定目标文字掩码;对所述目标文字掩码进行边界检测,获得检测结果,并根据检测结果确定目标文字区域边界检测结果。
[0008]优选地,所述根据所述初始文字掩码确定文字掩码重叠率,并根据所述文字掩码
重叠率以及所述置信度确定目标文字掩码的步骤,具体包括:根据所述初始文字掩码确定文字掩码重叠率,并判断文字掩码重叠率是否大于预设阈值;在所述文字掩码重叠率大于预设阈值时,根据所述置信度对所述初始文字掩码进行排序,获得排序结果;根据所述排序结果对所述初始文字掩码进行筛选,获得目标文字掩码。
[0009]优选地,所述根据所述图像特征以及预设区域建议网络确定初始候选区域,并对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征的步骤,具体包括:根据所述图像特征以及预设区域建议网络确定初始候选区域;通过预设形变兴趣区域池化模型对所述初始候选区域进行分析,获得形变偏移量;根据所述形变偏移量对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征。
[0010]优选地,所述获取待处理图像,并通过预设主干网络对所述待处理图像进行特征提取,获得图像特征的步骤之前,所述文字区域边界检测方法还包括:获取初始样本图像,并对所述初始样本图像进行尺度调整,获得待处理样本图像;通过预设滑动窗口对所述待处理样本图像进行图像提取,获得待处理样本子图像;对所述待处理子图像进行特征分析,获得正例样本子图像和负例样本子图像;根据所述正例样本子图像以及所述负例样本子图像对初始区域建议网络进行训练,获得预设区域建立网络。
[0011]优选地,所述对所述待处理子图像进行特征分析,获得正例样本子图像和负例样本子图像的步骤,具体包括:获取所述待处理子图像的图像尺寸,并查找所述图像尺寸对应的阈值范围;对所述待处理子图像进行分析,获得文字包围框;获取所述文字包围框的各边界长度,并根据所述边界长度以及所述阈值范围确定正例样本子图像和负例样本子图像。
[0012]优选地,所述根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果的步骤之前,所述文字区域边界检测方法还包括:根据所述待处理图像确定形状结构约束函数;根据所述形状结构约束函数对初始文字掩码分割网络进行训练,获得预设文字掩码分割网络。
[0013]此外,为实现上述目的,本专利技术还提出一种文字区域边界检测设备,所述文字区域边界检测设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文字区域边界检测程序,所述文字区域边界检测程序配置为实现如上文所述的文字区域边界检测方法的步骤。
[0014]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有文字区域边界检测程序,所述文字区域边界检测程序被处理器执行时实现如上文所述的文字区域边界检测方法的步骤。
[0015]此外,为实现上述目的,本专利技术还提出一种文字区域边界检测装置,所述文字区域边界检测装置包括:获取模块、处理模块、分析模块、检测模块和调整模块;所述获取模块,用于获取待处理图像,并通过预设主干网络对所述待处理图像进行特征提取,获得图像特征;所述处理模块,用于根据所述图像特征以及预设区域建议网络确定初始候选区域,并对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征;所述分析模块,用于通过预设文字区域调整网络对所述第一固定特征进行分析,获得特征分析结果;所述检测模块,用于根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果;所述调整模块,用于根据所述特征分析结果对所述初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果。
[0016]相较于现有的只通过探究任意形状文字的表达形式或增强特征表达进行场景文字检测的方式,本专利技术中,通过获取待处理图像,并通过预设主干网络对待处理图像进行特征提取,获得图像特征,根据图像特征以及预设区域建议网络确定初始候选区域,并对初始候选区域进行池化处理,获得第一固定特征和第二固定特征,通过预设文字区域调整网络对第一固定特征进行分析,获得特征分析结果,根据预设文字掩码分割网络以及第二固定特征确定初始文字区域边界检测结果,根据特征分析结果对初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果,克服了现有技术中无法精确识别任意形状文字的区域边界的缺陷,从而能够优化文字的区域边界检测过程,提高文字区域边界检测的准确性、可靠性,以满足场景文字检测的需求。
附图说明
[0017]图1是本专利技术实施例方案涉及的硬件运行环境的文字区域边界检测设备的结构示意图;图2为本专利技术文字区域边界检测方法第一实施例的流程示意图;图3为本专利技术文字区域边界检测方法第二实施例的流程示意图;图4为本专利技术文字区域边界检测方法第三实施例的流程示意图;图5为本专利技术文字区域边界检测装置第一实施例的结构框图。
[0018]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0019]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0020]参照图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字区域边界检测方法,其特征在于,所述文字区域边界检测方法包括以下步骤:获取待处理图像,并通过预设主干网络对所述待处理图像进行特征提取,获得图像特征;根据所述图像特征以及预设区域建议网络确定初始候选区域,并对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征;通过预设文字区域调整网络对所述第一固定特征进行分析,获得特征分析结果;根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果;根据所述特征分析结果对所述初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果。2.如权利要求1所述的文字区域边界检测方法,其特征在于,所述根据所述特征分析结果对所述初始文字区域边界检测结果进行调整,获得目标文字区域边界检测结果的步骤,具体包括:从所述特征分析结果中获取置信度和位置偏移,并根据所述初始文字区域边界以及所述位置偏移确定初始文字掩码;根据所述初始文字掩码确定文字掩码重叠率,并根据所述文字掩码重叠率以及所述置信度确定目标文字掩码;对所述目标文字掩码进行边界检测,获得检测结果,并根据检测结果确定目标文字区域边界检测结果。3.如权利要求2所述的文字区域边界检测方法,其特征在于,所述根据所述初始文字掩码确定文字掩码重叠率,并根据所述文字掩码重叠率以及所述置信度确定目标文字掩码的步骤,具体包括:根据所述初始文字掩码确定文字掩码重叠率,并判断文字掩码重叠率是否大于预设阈值;在所述文字掩码重叠率大于预设阈值时,根据所述置信度对所述初始文字掩码进行排序,获得排序结果;根据所述排序结果对所述初始文字掩码进行筛选,获得目标文字掩码。4.如权利要求1所述的文字区域边界检测方法,其特征在于,所述根据所述图像特征以及预设区域建议网络确定初始候选区域,并对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征的步骤,具体包括:根据所述图像特征以及预设区域建议网络确定初始候选区域;通过预设形变兴趣区域池化模型对所述初始候选区域进行分析,获得形变偏移量;根据所述形变偏移量对所述初始候选区域进行池化处理,获得第一固定特征和第二固定特征。5.如权利要求1所述的文字区域边界检测方法,其特征在于,所述获取待处理图像,并通过预设主干网络对所述待处理图像进行特征提取,获得图像特征的步骤之前,所述文字区域边界检测方法还包括:获取初始样本图像,并对所述初始样本图像进行尺度调整,获得待处理样本图像;通...

【专利技术属性】
技术研发人员:操晓春代朋纹张华
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1