文本遮挡区域检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34803468 阅读：14 留言：0更新日期：2022-09-03 20:10

本公开提供一种文本遮挡区域检测方法、装置、电子设备及存储介质，涉及图像处理技术领域，具体涉及计算机视觉、图像识别、文本处理技术领域，可应用于图片或视频中的文本遮挡区域检测等场景。具体实现方案包括：获取待检测的第一图像；合并第一图像中像素值之间的距离小于预设距离阈值的像素点，并重复执行合并第一图像的像素点的步骤直至满足预设条件，得到多个聚类像素值；根据聚类像素值对第一图像进行实例分割，得到与多个聚类像素值一一对应的多个颜色实例分割区域；根据颜色实例分割区域和第一图像中的文本框的交叠关系，从多个颜色实例分割区域中确定第一图像中的文本遮挡区域。本公开可以提高文本遮挡区域检测的速度、降低误检率。误检率。误检率。

全部详细技术资料下载

【技术实现步骤摘要】
文本遮挡区域检测方法、装置、电子设备及存储介质

[0001]本公开涉及图像处理
，具体涉及计算机视觉、图像识别、文本处理
，可应用于图片或视频中的文本遮挡区域检测等场景，尤其涉及一种文本遮挡区域检测方法、装置、电子设备及存储介质。

技术介绍

[0002]在一些网站或应用程序(如贴吧)的界面中，用户可以发布图片、视频等信息。当图片或视频中出现的文本涉及到一些隐私信息或敏感信息时，用户通常会采用一些图案(如表情、涂鸦等)来进行遮挡。这些图案在图片或视频中所在的区域可以称为文本遮挡区域。
[0003]网站或应用程序的提供方在审核用户发布的图片、视频等信息是否符合发布要求时，需要先检测用户发布的图片、视频等信息中是否存在文本遮挡区域，以进行进一步处理，如去除文本遮挡区域的遮挡图案。
[0004]目前的文本遮挡区域检测方式检测速度慢、且误检率高。

技术实现思路

[0005]本公开提供了一种文本遮挡区域检测方法、装置、电子设备及存储介质，可以提高文本遮挡区域检测的速度、降低误检率。
[0006]根据本公开的第一方面，提供了一种文本遮挡区域检测方法，所述方法包括：获取待检测的第一图像。合并第一图像中像素值之间的距离小于预设距离阈值的像素点，并重复执行合并第一图像的像素点的步骤直至满足预设条件，得到多个聚类像素值。根据每个聚类像素值对第一图像进行实例分割，得到与多个聚类像素值一一对应的多个颜色实例分割区域。根据每个颜色实例分割区域和第一图像中的文本框的交叠关系，从多个颜色实例分割区...

【技术保护点】

【技术特征摘要】
1.一种文本遮挡区域检测方法，其特征在于，所述方法包括：获取待检测的第一图像；合并所述第一图像中像素值之间的距离小于预设距离阈值的像素点，并重复执行所述合并所述第一图像的像素点的步骤直至满足预设条件，得到多个聚类像素值；根据每个所述聚类像素值对所述第一图像进行实例分割，得到与多个聚类像素值一一对应的多个颜色实例分割区域；根据每个所述颜色实例分割区域和所述第一图像中的文本框的交叠关系，从多个所述颜色实例分割区域中确定所述第一图像中的文本遮挡区域。2.根据权利要求1所述的方法，其特征在于，所述预设距离阈值包括第一距离阈值和第二距离阈值，所述预设条件包括第一预设条件和第二预设条件；所述合并所述第一图像中像素值之间的距离小于预设距离阈值的像素点，并重复执行所述合并所述第一图像的像素点的步骤直至满足预设条件，包括：将所述第一图像分割为多个第二图像；合并每个所述第二图像中像素值之间的距离小于所述第一距离阈值的像素点，并重复执行所述合并每个所述第二图像的像素点的步骤直至满足所述第一预设条件；在重复执行所述合并每个所述第二图像的像素点的步骤直至满足所述第一预设条件后，合并多个所述第二图像中像素值之间的距离小于所述第二距离阈值的像素点，并重复执行所述合并多个所述第二图像的像素点的步骤直至满足所述第二预设条件。3.根据权利要求2所述的方法，其特征在于，所述第一预设条件，包括：每个所述第二图像中任意两个像素点之间的距离小于第三距离阈值，或者，重复执行所述合并每个所述第二图像的像素点的步骤的迭代次数达到第一次数；所述第二预设条件，包括：多个所述第二图像中任意两个像素点之间的距离小于第四距离阈值，或者，重复执行所述合并多个所述第二图像的像素点的步骤的迭代次数达到第二次数。4.根据权利要求3所述的方法，其特征在于，所述第一距离阈值等于所述第二距离阈值。5.根据权利要求3或4所述的方法，其特征在于，所述第三距离阈值等于所述第四距离阈值，所述第一次数等于所述第二次数。6.根据权利要求3
‑
5任一项所述的方法，其特征在于，所述第三距离阈值等于所述第一距离阈值，所述第四距离阈值等于所述第二距离阈值。7.根据权利要求1
‑
6任一项所述的方法，其特征在于，所述根据每个所述聚类像素值对所述第一图像进行实例分割，得到与多个聚类像素值一一对应的多个颜色实例分割区域，包括：根据每个所述聚类像素值对所述第一图像进行颜色降维，得到颜色降维后的第一图像；根据每个所述聚类像素值，对所述颜色降维后的第一图像进行二值化处理，得到每个所述聚类像素值对应的二值化图像；从每个所述聚类像素值对应的二值化图像中提取连通区域，得到每个所述聚类像素值对应的颜色实例分割区域。
8.根据权利要求7所述的方法，其特征在于，所述从每个所述聚类像素值对应的二值化图像中提取连通区域之前，所述方法还包括：对所述二值化图像依次进行腐蚀处理、膨胀处理和腐蚀处理。9.根据权利要求1
‑
8任一项所述的方法，其特征在于，所述根据每个所述颜色实例分割区域和所述第一图像中的文本框的交叠关系，从多个所述颜色实例分割区域中确定所述第一图像中的文本遮挡区域，包括：获取所述颜色实例分割区域和所述文本框的交叠区域的面积与所述文本框的面积的第一比值、所述交叠区域的面...

【专利技术属性】
技术研发人员：常战国，吕一，邓天生，贠挺，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人