文字区域边界检测方法、设备、存储介质及装置制造方法及图纸

技术编号：27817915 阅读：16 留言：0更新日期：2021-03-30 10:22

本发明专利技术公开了一种文字区域边界检测方法、设备、存储介质及装置，相较于现有的只通过探究任意形状文字的表达形式或增强特征表达进行场景文字检测的方式，本发明专利技术中，通过预设主干网络对待处理图像进行特征提取，获得图像特征，根据图像特征以及预设区域建议网络确定初始候选区域，并对初始候选区域进行池化处理，获得第一固定特征和第二固定特征，通过预设文字区域调整网络对第一固定特征进行分析，获得特征分析结果，根据预设文字掩码分割网络、第二固定特征以及特征分析结果确定目标文字区域边界检测结果，克服了现有技术中无法精确识别任意形状文字的区域边界的缺陷，从而能够优化文字的区域边界检测过程，提高文字区域边界检测的准确性。检测的准确性。检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文字区域边界检测方法、设备、存储介质及装置

[0001]本专利技术涉及图像识别
，尤其涉及一种文字区域边界检测方法、设备、存储介质及装置。

技术介绍

[0002]现有技术为实现任意形状场景文字的检测，通常致力于探究任意形状文字的表达形式，例如，如何更好地学习像素点或文字片段的属性及之间的关系以区分文字区域，或者是致力于增强特征表达，例如，结合不同粒度的特征或者学习上下文特征等。
[0003]但是，现有技术中无法精确识别任意形状文字的区域边界，从而导致任意形状场景文字的检测准确率低、可靠性差。
[0004]上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

[0005]本专利技术的主要目的在于提供一种文字区域边界检测方法、设备、存储介质及装置，旨在解决如何优化文字的区域边界检测过程的技术问题。
[0006]为实现上述目的，本专利技术提供一种文字区域边界检测方法，所述文字区域边界检测方法包括以下步骤：获取待处理图像，并通过预设主干网络对所述待处理图像进行特征提取，获得图像特征；根据所述图像特征以及预设区域建议网络确定初始候选区域，并对所述初始候选区域进行池化处理，获得第一固定特征和第二固定特征；通过预设文字区域调整网络对所述第一固定特征进行分析，获得特征分析结果；根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果；根据所述特征分析结果对所述初始文字区域边界检测结果进行调整，获得目标文字区域边界检测结果。
[...

【技术保护点】

【技术特征摘要】
1.一种文字区域边界检测方法，其特征在于，所述文字区域边界检测方法包括以下步骤：获取待处理图像，并通过预设主干网络对所述待处理图像进行特征提取，获得图像特征；根据所述图像特征以及预设区域建议网络确定初始候选区域，并对所述初始候选区域进行池化处理，获得第一固定特征和第二固定特征；通过预设文字区域调整网络对所述第一固定特征进行分析，获得特征分析结果；根据预设文字掩码分割网络以及所述第二固定特征确定初始文字区域边界检测结果；根据所述特征分析结果对所述初始文字区域边界检测结果进行调整，获得目标文字区域边界检测结果。2.如权利要求1所述的文字区域边界检测方法，其特征在于，所述根据所述特征分析结果对所述初始文字区域边界检测结果进行调整，获得目标文字区域边界检测结果的步骤，具体包括：从所述特征分析结果中获取置信度和位置偏移，并根据所述初始文字区域边界以及所述位置偏移确定初始文字掩码；根据所述初始文字掩码确定文字掩码重叠率，并根据所述文字掩码重叠率以及所述置信度确定目标文字掩码；对所述目标文字掩码进行边界检测，获得检测结果，并根据检测结果确定目标文字区域边界检测结果。3.如权利要求2所述的文字区域边界检测方法，其特征在于，所述根据所述初始文字掩码确定文字掩码重叠率，并根据所述文字掩码重叠率以及所述置信度确定目标文字掩码的步骤，具体包括：根据所述初始文字掩码确定文字掩码重叠率，并判断文字掩码重叠率是否大于预设阈值；在所述文字掩码重叠率大于预设阈值时，根据所述置信度对所述初始文字掩码进行排序，获得排序结果；根据所述排序结果对所述初始文字掩码进行筛选，获得目标文字掩码。4.如权利要求1所述的文字区域边界检测方法，其特征在于，所述根据所述图像特征以及预设区域建议网络确定初始候选区域，并对所述初始候选区域进行池化处理，获得第一固定特征和第二固定特征的步骤，具体包括：根据所述图像特征以及预设区域建议网络确定初始候选区域；通过预设形变兴趣区域池化模型对所述初始候选区域进行分析，获得形变偏移量；根据所述形变偏移量对所述初始候选区域进行池化处理，获得第一固定特征和第二固定特征。5.如权利要求1所述的文字区域边界检测方法，其特征在于，所述获取待处理图像，并通过预设主干网络对所述待处理图像进行特征提取，获得图像特征的步骤之前，所述文字区域边界检测方法还包括：获取初始样本图像，并对所述初始样本图像进行尺度调整，获得待处理样本图像；通...

【专利技术属性】
技术研发人员：操晓春，代朋纹，张华，
申请(专利权)人：鹏城实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人