目标检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25837139 阅读:15 留言:0更新日期:2020-10-02 14:17
本申请公开了目标检测方法、装置、电子设备及存储介质,具体实现方案为:响应于采集处理,得到包含目标文本的待处理图片;将所述待处理图片输入预先训练的目标检测网络,得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。采用本申请,可以提高目标检测的准确率。

【技术实现步骤摘要】
目标检测方法、装置、电子设备及存储介质
本申请涉及计算机视觉
,尤其涉及一种目标检测方法、装置、电子设备及存储介质。
技术介绍
随着便携设备、手机终端等电子设备相比以往更智能化,芯片的解析能力更强,可以通过计算机视觉技术对图文信息、视频信息等进行高效的解析,并对图文信息、视频信息等中的目标对象进行检测。以版面分析的应用场景为例,在版面分析过程中采集得到的图片中,该目标对象多数为文本信息,由于文本信息的纹理特征缺乏形状信息,相比较于诸如视频信息而言,不容易识别及分类,因此,导致对于文本信息的目标检测,其准确率较低,从而最终影响到对版面分析的准确率,相关技术中,对如何提高文本信息的目标检测准确率,未存在有效的解决方案。
技术实现思路
本申请提供了一种目标检测方法、装置、电子设备及存储介质。根据本申请的一方面,提供了一种目标检测方法,包括:响应于采集处理,得到包含目标文本的待处理图片;将所述待处理图片输入预先训练的目标检测网络,得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。根据本申请的另一方面,提供了一种目标检测装置,包括:图片采集模块,用于响应于采集处理,得到包含目标文本的待处理图片;候选检测框获取模块,用于将所述待处理图片输入预先训练的目标检测网络,得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;目标检测模块,用于根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本申请任意一实施例所提供的方法。根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本申请任意一项实施例所提供的方法。采用本申请,可以响应于采集处理,得到包含目标文本的待处理图片;将所述待处理图片输入预先训练的目标检测网络,可以得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,可以识别出包含所述目标文本的候选检测框、及包含所述目标文本中部分文本的候选检测框,以从所识别得到的这些候选检测框中,去除误检测的包含所述目标文本中部分文本的候选检测框,最终得到去除包含所述目标文本中部分文本的候选检测框后得到目标检测框,从而提高了针对目标文本信息的目标检测准确率。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1-图2是根据本申请实施例的输出检测框及对输出检测框过滤的示意图;图3是根据本申请实施例的一交并比运算的示意图;图4-图7是根据本申请实施例的候选检测框存在框中框或类框中框的多个示意图;图8是根据本申请实施例的目标检测方法的流程示意图;图9是根据本申请实施例的一重叠区域运算的示意图;图10-图11是根据本申请实施例的版面分析中所应用的运算模式的示意图;图12是根据本申请实施例的目标检测装置的组成结构示意图;图13是用来实现本申请实施例的目标检测方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。就目标检测而言,可以采用非极大值抑制(NMS,Non-maximumsuppression)算法,该算法是针对目标检测算法的一个后处理算法,该目标检测算法可以是单级多框预测(SSD,SingleShotMultiBoxDetector)算法,通过SSD算法,可以直接预测出待检测目标对象类别及针对该目标对象的检测框。图1-图2是根据本申请实施例的输出检测框及对输出检测框过滤的示意图,如图1所示,采用SSD算法,针对同一个目标(如人脸)会输出大于实际目标数量的检测框,可以通过NMS算法,对采用SSD算法输出的多个检测框,比如,将同一个目标附近输出的多个相互重叠的检测框进行过滤,仅在每一个目标上保留一个最精确的框,如图2所示。一示例中,设置候选的检测框集合B、和该检测框集合B对应的用于表示候选检测框置信度的得分(scores)集合S,它们一一对应,即每一个检测框都有一个给定的score,通过NMS算法,对采用SSD算法输出的多个检测框进行所述过滤,包括人如下内容:1.找出score最高的检测框M,即找出置信度最高的检测框M,并作为选定框;2.将检测框M从对应的检测框集合B中删除;3.将该检测框M添加到可信任的目标检测框集合D中;4.从检测框集合B中查找与该检测框M对应的周边检测框,并将该周边检测框作为相对于该检测框M这个选定框的比对框,若该选定本文档来自技高网...

【技术保护点】
1.一种目标检测方法,其特征在于,所述方法包括:/n响应于采集处理,得到包含目标文本的待处理图片;/n将所述待处理图片输入预先训练的目标检测网络,得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;/n根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。/n

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:
响应于采集处理,得到包含目标文本的待处理图片;
将所述待处理图片输入预先训练的目标检测网络,得到包含所述目标文本及包含所述目标文本中部分文本的至少两个候选检测框,所述部分文本为:与所述目标文本全部重叠或部分重叠的文本区域且包含至少一行文本序列;
根据所述至少两个候选检测框的重叠区域运算得到分类指标,根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述至少两个候选检测框中,提取包含所述目标文本的第一检测框及包含所述目标文本中部分文本的第二检测框;
根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算,得到重叠区域指标;
将所述重叠区域指标作为所述分类指标。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算,得到重叠区域指标,包括:
将所述第一检测框及所述第二检测框的重叠区域作为交集;
将所述第二检测框的框面积区域作为并集;
根据所述交集及所述并集进行所述重叠区域运算,得到所述重叠区域指标。


4.根据权利要求2或3所述的方法,其特征在于,所述根据所述分类指标对所述至少两个候选检测框进行分类筛选,以去除包含所述目标文本中部分文本的候选检测框后得到目标检测框包括:
将所述分类指标与用于所述分类筛选的预设阈值进行比对,得到比对结果;
若所述比对结果为所述分类指标大于所述预设阈值的候选检测框为所述第二检测框,则从所述至少两个候选检测框中删除所述第二检测框,以得到所述目标检测框。


5.根据权利要求2或3所述的方法,其特征在于,所述重叠区域包括:
所述第一检测框及所述第二检测框存在所述全部重叠所得到的第一区域;和/或,
所述第一检测框及所述第二检测框存在所述部分重叠所得到的第二区域。


6.根据权利要求2或3所述的方法,其特征在于,所述从所述至少两个候选检测框中,提取包含所述目标文本的第一检测框及包含所述目标文本中部分文本的第二检测框,包括:
从所述至少两个候选检测框中,提取候选的第一检测框中置信度最高的第一选定框;
根据所述第一检测框与周边候选的第二检测框的距离,得到距离所述第一检测框最近的第二比对框;
相应的,所述根据所述第一检测框及所述第二检测框的重叠区域进行所述重叠区域运算,得到重叠区域指标,包括:
根据所述第一选定框及所述第二比对框进行所述重叠区域运算,得到所述重叠区域指标。


7.根据权利要求1所述的方法,其特征在于,所述将所述待处理图片输入预先训练的目标检测网络,还包括:
根据所述预先训练的目标检测网络,对所述待处理图片中的所述目标文本进行特征提取,得到目标文本的纹理特征;
所述纹理特征包括:用于版面分析的竖式运算、脱式运算、方程式运算中的至少一种特征。


8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将包含目标文本的待处理图片数据作为训练样本数据;
根据所述训练样本数据、及用于所述目标检测网络训练的标注数据进行损失运算,得到损失函数;
根据所述损失函数的反向传播对所述目标检测网络进行训练,得到训练后目标检测网络,将所述训练后目标检测网络作为所述预先训练的目标检测网络。


9.一种目标检测装置,其特征在于,所述装置包括:
图片采集模块,用于响应于采集处理,得到包含目标文本的...

【专利技术属性】
技术研发人员:康凯李兵秦勇
申请(专利权)人:北京易真学思教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1