文本遮挡区域检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34803468 阅读:14 留言:0更新日期:2022-09-03 20:10
本公开提供一种文本遮挡区域检测方法、装置、电子设备及存储介质,涉及图像处理技术领域,具体涉及计算机视觉、图像识别、文本处理技术领域,可应用于图片或视频中的文本遮挡区域检测等场景。具体实现方案包括:获取待检测的第一图像;合并第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行合并第一图像的像素点的步骤直至满足预设条件,得到多个聚类像素值;根据聚类像素值对第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域;根据颜色实例分割区域和第一图像中的文本框的交叠关系,从多个颜色实例分割区域中确定第一图像中的文本遮挡区域。本公开可以提高文本遮挡区域检测的速度、降低误检率。误检率。误检率。

【技术实现步骤摘要】
文本遮挡区域检测方法、装置、电子设备及存储介质


[0001]本公开涉及图像处理
,具体涉及计算机视觉、图像识别、文本处理
,可应用于图片或视频中的文本遮挡区域检测等场景,尤其涉及一种文本遮挡区域检测方法、装置、电子设备及存储介质。

技术介绍

[0002]在一些网站或应用程序(如贴吧)的界面中,用户可以发布图片、视频等信息。当图片或视频中出现的文本涉及到一些隐私信息或敏感信息时,用户通常会采用一些图案(如表情、涂鸦等)来进行遮挡。这些图案在图片或视频中所在的区域可以称为文本遮挡区域。
[0003]网站或应用程序的提供方在审核用户发布的图片、视频等信息是否符合发布要求时,需要先检测用户发布的图片、视频等信息中是否存在文本遮挡区域,以进行进一步处理,如去除文本遮挡区域的遮挡图案。
[0004]目前的文本遮挡区域检测方式检测速度慢、且误检率高。

技术实现思路

[0005]本公开提供了一种文本遮挡区域检测方法、装置、电子设备及存储介质,可以提高文本遮挡区域检测的速度、降低误检率。
[0006]根据本公开的第一方面,提供了一种文本遮挡区域检测方法,所述方法包括:获取待检测的第一图像。合并第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行合并第一图像的像素点的步骤直至满足预设条件,得到多个聚类像素值。根据每个聚类像素值对第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域。根据每个颜色实例分割区域和第一图像中的文本框的交叠关系,从多个颜色实例分割区域中确定第一图像中的文本遮挡区域。
[0007]根据本公开的第二方面,提供了一种文本遮挡区域检测装置,所述装置包括:获取单元、聚类单元、分割单元、以及检测单元。
[0008]获取单元,用于获取待检测的第一图像。聚类单元,用于合并第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行合并第一图像的像素点的步骤直至满足预设条件,得到多个聚类像素值。分割单元,用于根据每个聚类像素值对第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域。检测单元,用于根据每个颜色实例分割区域和第一图像中的文本框的交叠关系,从多个颜色实例分割区域中确定第一图像中的文本遮挡区域。
[0009]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的方法。
[0010]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,所述计算机指令用于使计算机执行根据第一方面所述的方法。
[0011]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。
[0012]本公开通过获取待检测的第一图像;合并第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行合并第一图像的像素点的步骤直至满足预设条件,得到多个聚类像素值;根据每个聚类像素值对第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域;根据每个颜色实例分割区域和第一图像中的文本框的交叠关系,从多个颜色实例分割区域中确定第一图像中的文本遮挡区域,可以实现对不同类型的文本遮挡区域进行统一的检测。使用本公开提供的方法对第一图像进行文本遮挡区域检测时,可以具有较低的误检率。而且,本公开提供的方法通过提高颜色聚类过程的聚类速度,大大提高了文本遮挡区域检测的速度。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1为本公开实施例提供的文本遮挡区域检测方法的流程示意图;
[0016]图2为本公开实施例提供的图1中S102的一种实现方式的流程示意图;
[0017]图3为本公开实施例提供的图1中S103的一种实现方式的流程示意图;
[0018]图4为本公开实施例提供的第一图像的示意图;
[0019]图5为本公开实施例提供的图4所示的第一图像的二值化图像的示意图;
[0020]图6为本公开实施例提供的图1中S103的另一种实现方式的流程示意图;
[0021]图7为本公开实施例提供的图4所示的第一图像中的文本框的示意图;
[0022]图8为本公开实施例提供的图5所示的二值化图像中提取的颜色实例分割区域的示意图;
[0023]图9为本公开实施例提供的文本遮挡区域检测方法的另一流程示意图;
[0024]图10为本公开实施例提供的文本遮挡区域检测装置的组成示意图;
[0025]图11为本公开实施例提供的文本遮挡区域检测装置的另一组成示意图;
[0026]图12为本公开实施例提供的文本遮挡区域检测装置的又一组成示意图;
[0027]图13为本公开实施例提供的文本遮挡区域检测装置的又一组成示意图;
[0028]图14示出了可以用来实施本公开的实施例的示例电子设备1400的示意性框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]在一些网站或应用程序(如贴吧)的界面中,用户可以发布图片、视频等信息。网站或应用程序的提供方通常需要对用户发布的图片、视频等信息进行审核,以确定其是否符
合发布要求。例如,网站或应用程序的提供方可以采用一些光学字符识别(optical character recognition,OCR)算法,识别用户发布的图片、视频等信息中是否存在一些隐私信息或敏感信息(如敏感词或敏感人名等),以确定用户发布的图片、视频等信息是否符合发布要求。
[0031]当图片或视频中出现的文本涉及到一些隐私信息或敏感信息时,用户通常会采用一些图案(如表情、涂鸦等)来进行遮挡。这些图案在图片或视频中所在的区域可以称为文本遮挡区域。对于这类包含文本遮挡区域的图片或视频,OCR算法无法实现准确的识别。因此,网站或应用程序的提供方对用户发布的图片、视频等信息进行审核时,还需要判断用户发布的图片、视频等信息中是否存在文本遮挡区域,以进行进一步处理,如去除文本遮挡区域的遮挡图案。
[0032]在实际场景中,用户所使用的遮挡图案众多且颜色不一,文本遮挡区域存在各种不同的类型。目前的文本遮挡区域检测方式无法实现对不同类型的文本遮挡本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本遮挡区域检测方法,其特征在于,所述方法包括:获取待检测的第一图像;合并所述第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行所述合并所述第一图像的像素点的步骤直至满足预设条件,得到多个聚类像素值;根据每个所述聚类像素值对所述第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域;根据每个所述颜色实例分割区域和所述第一图像中的文本框的交叠关系,从多个所述颜色实例分割区域中确定所述第一图像中的文本遮挡区域。2.根据权利要求1所述的方法,其特征在于,所述预设距离阈值包括第一距离阈值和第二距离阈值,所述预设条件包括第一预设条件和第二预设条件;所述合并所述第一图像中像素值之间的距离小于预设距离阈值的像素点,并重复执行所述合并所述第一图像的像素点的步骤直至满足预设条件,包括:将所述第一图像分割为多个第二图像;合并每个所述第二图像中像素值之间的距离小于所述第一距离阈值的像素点,并重复执行所述合并每个所述第二图像的像素点的步骤直至满足所述第一预设条件;在重复执行所述合并每个所述第二图像的像素点的步骤直至满足所述第一预设条件后,合并多个所述第二图像中像素值之间的距离小于所述第二距离阈值的像素点,并重复执行所述合并多个所述第二图像的像素点的步骤直至满足所述第二预设条件。3.根据权利要求2所述的方法,其特征在于,所述第一预设条件,包括:每个所述第二图像中任意两个像素点之间的距离小于第三距离阈值,或者,重复执行所述合并每个所述第二图像的像素点的步骤的迭代次数达到第一次数;所述第二预设条件,包括:多个所述第二图像中任意两个像素点之间的距离小于第四距离阈值,或者,重复执行所述合并多个所述第二图像的像素点的步骤的迭代次数达到第二次数。4.根据权利要求3所述的方法,其特征在于,所述第一距离阈值等于所述第二距离阈值。5.根据权利要求3或4所述的方法,其特征在于,所述第三距离阈值等于所述第四距离阈值,所述第一次数等于所述第二次数。6.根据权利要求3

5任一项所述的方法,其特征在于,所述第三距离阈值等于所述第一距离阈值,所述第四距离阈值等于所述第二距离阈值。7.根据权利要求1

6任一项所述的方法,其特征在于,所述根据每个所述聚类像素值对所述第一图像进行实例分割,得到与多个聚类像素值一一对应的多个颜色实例分割区域,包括:根据每个所述聚类像素值对所述第一图像进行颜色降维,得到颜色降维后的第一图像;根据每个所述聚类像素值,对所述颜色降维后的第一图像进行二值化处理,得到每个所述聚类像素值对应的二值化图像;从每个所述聚类像素值对应的二值化图像中提取连通区域,得到每个所述聚类像素值对应的颜色实例分割区域。
8.根据权利要求7所述的方法,其特征在于,所述从每个所述聚类像素值对应的二值化图像中提取连通区域之前,所述方法还包括:对所述二值化图像依次进行腐蚀处理、膨胀处理和腐蚀处理。9.根据权利要求1

8任一项所述的方法,其特征在于,所述根据每个所述颜色实例分割区域和所述第一图像中的文本框的交叠关系,从多个所述颜色实例分割区域中确定所述第一图像中的文本遮挡区域,包括:获取所述颜色实例分割区域和所述文本框的交叠区域的面积与所述文本框的面积的第一比值、所述交叠区域的面...

【专利技术属性】
技术研发人员:常战国吕一邓天生贠挺
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1