目标检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：25837139 阅读：15 留言：0更新日期：2020-10-02 14:17

本申请公开了目标检测方法、装置、电子设备及存储介质，具体实现方案为：响应于采集处理，得到包含目标文本的待处理图片；将所述待处理图片输入预先训练的目标检测网络，得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框，所述部分文本为：与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列；根据所述至少两个候选检测框的重叠区域运算得到分类指标，根据所述分类指标对所述至少两个候选检测框进行分类筛选，以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。采用本申请，可以提高目标检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测方法、装置、电子设备及存储介质
本申请涉及计算机视觉
，尤其涉及一种目标检测方法、装置、电子设备及存储介质。
技术介绍
随着便携设备、手机终端等电子设备相比以往更智能化，芯片的解析能力更强，可以通过计算机视觉技术对图文信息、视频信息等进行高效的解析，并对图文信息、视频信息等中的目标对象进行检测。以版面分析的应用场景为例，在版面分析过程中采集得到的图片中，该目标对象多数为文本信息，由于文本信息的纹理特征缺乏形状信息，相比较于诸如视频信息而言，不容易识别及分类，因此，导致对于文本信息的目标检测，其准确率较低，从而最终影响到对版面分析的准确率，相关技术中，对如何提高文本信息的目标检测准确率，未存在有效的解决方案。
技术实现思路
本申请提供了一种目标检测方法、装置、电子设备及存储介质。根据本申请的一方面，提供了一种目标检测方法，包括：响应于采集处理，得到包含目标文本的待处理图片；将所述待处理图片输入预先训练的目标检测网络，得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框，所述部分文本为：与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列；根据所述至少两个候选检测框的重叠区域运算得到分类指标，根据所述分类指标对所述至少两个候选检测框进行分类筛选，以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。根据本申请的另一方面，提供了一种目标检测装置，包括：图片采集模块，用于响应于采集处理，得到包含目标文...

【技术保护点】
1.一种目标检测方法，其特征在于，所述方法包括：/n响应于采集处理，得到包含目标文本的待处理图片；/n将所述待处理图片输入预先训练的目标检测网络，得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框，所述部分文本为：与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列；/n根据所述至少两个候选检测框的重叠区域运算得到分类指标，根据所述分类指标对所述至少两个候选检测框进行分类筛选，以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。/n

【技术特征摘要】
1.一种目标检测方法，其特征在于，所述方法包括：
响应于采集处理，得到包含目标文本的待处理图片；
将所述待处理图片输入预先训练的目标检测网络，得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框，所述部分文本为：与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列；
根据所述至少两个候选检测框的重叠区域运算得到分类指标，根据所述分类指标对所述至少两个候选检测框进行分类筛选，以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
从所述至少两个候选检测框中，提取包含所述目标文本的第一检测框及包含所述目标文本中部分文本的第二检测框；
根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算，得到重叠区域指标；
将所述重叠区域指标作为所述分类指标。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算，得到重叠区域指标，包括：
将所述第一检测框及所述第二检测框的重叠区域作为交集；
将所述第二检测框的框面积区域作为并集；
根据所述交集及所述并集进行所述重叠区域运算，得到所述重叠区域指标。

4.根据权利要求2或3所述的方法，其特征在于，所述根据所述分类指标对所述至少两个候选检测框进行分类筛选，以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框包括：
将所述分类指标与用于所述分类筛选的预设阈值进行比对，得到比对结果；
若所述比对结果为所述分类指标大于所述预设阈值的候选检测框为所述第二检测框，则从所述至少两个候选检测框中删除所述第二检测框，以得到所述目标检测框。

5.根据权利要求2或3所述的方法，其特征在于，所述重叠区域包括：
所述第一检测框及所述第二检测框存在所述全部重叠所得到的第一区域；和/或，
所述第一检测框及所述第二检测框存在所述部分重叠所得到的第二区域。

6.根据权利要求2或3所述的方法，其特征在于，所述从所述至少两个候选检测框中，提取包含所述目标文本的第一检测框及包含所述目标文本中部分文本的第二检测框，包括：
从所述至少两个候选检测框中，提取候选的第一检测框中置信度最高的第一选定框；
根据所述第一检测框与周边候选的第二检测框的距离，得到距离所述第一检测框最近的第二比对框；
相应的，所述根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算，得到重叠区域指标，包括：
根据所述第一选定框及所述第二比对框进行所述重叠区域运算，得到所述重叠区域指标。

7.根据权利要求1所述的方法，其特征在于，所述将所述待处理图片输入预先训练的目标检测网络，还包括：
根据所述预先训练的目标检测网络，对所述待处理图片中的所述目标文本进行特征提取，得到目标文本的纹理特征；
所述纹理特征包括：用于版面分析的竖式运算、脱式运算、方程式运算中的至少一种特征。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将包含目标文本的待处理图片数据作为训练样本数据；
根据所述训练样本数据、及用于所述目标检测网络训练的标注数据进行损失运算，得到损失函数；
根据所述损失函数的反向传播对所述目标检测网络进行训练，得到训练后目标检测网络，将所述训练后目标检测网络作为所述预先训练的目标检测网络。

9.一种目标检测装置，其特征在于，所述装置包括：
图片采集模块，用于响应于采集处理，得到包含目标文本的...

【专利技术属性】
技术研发人员：康凯，李兵，秦勇，
申请(专利权)人：北京易真学思教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人