文本擦除方法及装置、电子设备及可读存储介质制造方法及图纸

技术编号:38822300 阅读:26 留言:0更新日期:2023-09-15 20:01
本发明专利技术实施例提供了一种文本擦除方法及装置、电子设备及可读存储介质,涉及图像处理技术领域。方法包括:获取第一图像中的第一文本区域;获取第一文本区域对应的至少一个候选文本区域;获取第一文本区域和各个候选文本区域,分别对应的区域框选文本置信度;将第一文本区域和各个候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;对第一图像中的目标文本区域,进行擦除。本发明专利技术中,获取第一文本区域和各个候选文本区域,分别对应的区域框选文本置信度,该置信度可以体现文本区域框选文本的准确度,选择了框选文本准确度最高的文本区域,进而提升了文本和非文本分割的准确性,能够提升擦除效果。能够提升擦除效果。能够提升擦除效果。

【技术实现步骤摘要】
文本擦除方法及装置、电子设备及可读存储介质


[0001]本专利技术涉及图像处理
,特别是涉及文本擦除方法及装置、电子设备及可读存储介质。

技术介绍

[0002]将图像中已有的文本等进行擦除,可以实现该图像的复用等,因此,图像中文本擦除,具有广泛的应用空间。
[0003]目前,主要是先对图像中的文本和非文本进行分割,获得该图像中的文本区域,对该图像中的文本区域进行填充,实现文本擦除。
[0004]然而,现有技术中,对于图像中的文本和非文本分割不够准确,导致文本擦除效果也不够准确。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种文本擦除方法及装置、电子设备及可读存储介质,以实现准确的擦除图像中的文本的技术目的。具体技术方案如下:
[0006]在本专利技术实施的第一方面,首先提供了一种文本擦除方法,所述方法包括:
[0007]获取第一图像中的第一文本区域;
[0008]获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素;
[0009]获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度;
[0010]将所述第一文本区域和各个所述候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;
[0011]对所述第一图像中的所述目标文本区域,进行擦除。
[0012]在本专利技术实施的第二方面,还提供了一种文本擦除装置,所述装置包括:
[0013]第一文本区域获取模块,用于获取第一图像中的第一文本区域;
[0014]候选文本区域获取模块,用于获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素;
[0015]置信度获取模块,用于获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度;
[0016]目标文本区域确定模块,用于将所述第一文本区域和各个所述候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;
[0017]擦除模块,用于对所述第一图像中的所述目标文本区域,进行擦除。
[0018]在本专利技术实施的第三方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的文本擦
除方法。
[0019]在本专利技术实施的第四方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的文本擦除方法。
[0020]本专利技术实施例提供的文本擦除方法,通过获取第一图像中的第一文本区域对应的至少一个候选文本区域,然后获取第一文本区域和各个候选文本区域,分别对应的区域框选文本置信度,该区域框选置信度可以体现该文本区域框住文本像素的准确度,然后从第一文本区域和各个候选文本区域中,选择区域框选文本置信度最高的文本区域,作为目标文本区域,也就是说选择了框选文本像素准确度最高的文本区域,进而提升了文本和非文本分割的准确性,然后对该第一图像中的目标文本区域进行擦除,能够提升擦除效果,可以解决由于文本分割不够准确导致的擦除效果欠佳的问题,能够提升文本擦除效果。
附图说明
[0021]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0022]图1为本专利技术实施例中的一种文本擦除方法的步骤流程图;
[0023]图2为本专利技术实施例中的一种文本擦除方法的流程示意图;
[0024]图3为本专利技术实施例中的一种文本擦除装置的结构示意图;
[0025]图4为本专利技术实施例中的一种电子设备的示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。
[0027]图1为本专利技术实施例中的一种文本擦除方法的步骤流程图,如图1所示,该方法包括:
[0028]步骤101、获取第一图像中的第一文本区域。
[0029]此处的第一图像可以是图片或视频等,在本专利技术实施例中,对此不作具体限定。
[0030]例如,第一图像可以是视频中的某一帧图像或某几帧图像等,该第一图像中含有额外增加的文本等,视频中的图像通常较为复杂。
[0031]再例如,此处的第一图像可以是海报等,海报是常见的一种招贴形式,多用于电影、电视剧、戏剧、比赛、文艺演出、促销等活动。海报中通常包括活动的性质、主办单位、时间、地点等文本内容,多用于影视剧和新品宣传中,利用图片、文字、色彩、空间等要素进行完整的结合。海报中往往图文镶嵌,且海报中元素较多,背景较为复杂。
[0032]第一图像中的第一文本区域可以包括该第一图像中的所有文本的文本区域,或者,可以包括该第一图像中的部分文本的文本区域,本专利技术实施例对此不作具体限定。例如,第一图像为海报,海报的第一文本区域可以为包括其上的所有文本的区域。
[0033]可以采用语义分割等方式,对第一图像中的像素进行文本和非文本的二分类,得到第一图像中的第一文本区域。对于第一图像中的第一文本区域的获取方式也不作具体限定。
[0034]例如,该步骤可以为:将第一图像进行去噪,对去噪后的第一图像进行二值化,得到包括文字的前景区域,接着针对该前景区域,进行文字区域和非文字区域分割,得到第一
图像中的第一文本区域。
[0035]步骤102、获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素。
[0036]该步骤就是将第一图像中第一文本区域,在第一图像中进行扩大或缩小,得到该第一文本区域对应的至少一个候选文本区域。该候选文本区域的数量不作具体限定,各个候选文本区域的尺寸,与第一文本区域的尺寸的大小关系也不作具体限定。
[0037]各个候选文本区域均包含该第一文本区域中的至少部分像素,也就是说各个候选文本区域和第一文本区域均具有交叠的部分,至于交叠的部分的大小不作具体限定。
[0038]步骤103、获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度。
[0039]区域框选文本置信度表征的是该第一文本区域或候选文本区域,正好框住文本像素的准确程度。
[0040]可选的,第一文本区域或候选文本区域中除了文本像素之外的其他像素的数量越多,该区域框选文本置信度越低。和/或,第一文本区域或候选文本区域,漏框的文本像素的数量越多,该区域框选文本置信度也越低,就是说第一文本区域或候选文本区域的区域框选文本置信度,和该文本区域中除了文本像素之外的其他像素的数量成反比本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本擦除方法,其特征在于,所述方法包括:获取第一图像中的第一文本区域;获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素;获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度;将所述第一文本区域和各个所述候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;对所述第一图像中的所述目标文本区域,进行擦除。2.根据权利要求1所述的方法,其特征在于,所述获取所述第一文本区域对应的至少一个候选文本区域,包括:对所述第一图像中的第一文本区域进行至少一次扩充,得到所述第一文本区域对应的至少一个候选文本区域;所述候选文本区域的像素,包括所述第一文本区域中的全部像素,且所述候选文本区域的尺寸,大于所述第一文本区域的尺寸。3.根据权利要求1所述的方法,其特征在于,所述获取第一图像中的第一文本区域,包括:采用OCR,获取所述第一图像中的第一文本区域;所述获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度,包括:获取所述第一文本区域的OCR,对应的第一OCR置信度,并将所述第一OCR置信度,确定为所述第一文本区域对应的区域框选文本置信度;分别获取各个所述候选文本区域的OCR,对应的各个第二OCR置信度,并将各个所述第二OCR置信度,分别确定为各个所述候选文本区域对应的区域框选文本置信度。4.根据权利要求3所述的方法,其特征在于,所述获取所述第一文本区域的OCR,对应的第一OCR置信度,包括:将所述第一文本区域对应的子图像,输入预设的OCR卷积神经网络中,得到多组输出结果;每组所述输出结果包括:逻辑回归矩阵和字符识别结果;获取所述多组输出结果所包含的多个字符识别结果中,相同的字符识别结果;将与所述相同的字符识别结果,在同一组输出结果的逻辑回归矩阵,进行归一化处理,得到所述相同的字符识别结果中各个字符对应的各个概率值;将各个所述概率值中最小的概率值,确定为所述第一文本区域的OCR,对应的第一OCR置信度。5.根据权利要求2所述的方法,其特征在于,所述对所述第一图像中的第一文本区域进行至少一次扩充,得到所述第一文本区域对应的至少一个候选文本区域,包括:将所述第一文本区域,在所述第一图像中相互垂直的第一方向和第二方向上,分别向外扩充预设距离,以得到所述第一文本区域对应的至少一个候选文本区域。6.根据权利要求5所述的方法,其特征在于,所述将所述第一文本区域,在所述第一图像中相互垂直的第一方向和第二方向上,分别向外扩充预设距离,以得到所述第一文本区域对应的至少一个候选文本区域,包括:
将所述第一文本区域,在所述第一图像中所述第一方向的两侧上,分别均向外扩充3个第一预设距离,在所述第一图像中所述第二方向的两侧上,分别均向外扩充3个第二预设距离,得到所述第一文本区域对应的9个候选文本区域;所述第一方向为所述第一文本区域的高度所在的方向;所述第二方向为所述第一文本区域的宽度所在的方向。7.根据权利要求6所述的方法,其特征在于,所述3个第一预设距离包括:0.015倍的所述第一文本区域在所述第一方向上的第一尺寸、0.025倍的所述第一尺寸、0.035倍的所述第一尺寸;所述3个第二预设距离包括:0.005倍的所述第一文本区域在所述第二方向上的第二尺寸、0.01倍的所述第二尺寸、0.015倍的所述第二尺寸。8.根据权利要求1所述的方法,其特征在于,所述区域框选文本置信度,与所述文本区域中除了文本像素之外的其他像素的数量成反比;和/或,所述区域框选文本置信度,与所述文本区域漏框的文本像素的数量成反比...

【专利技术属性】
技术研发人员:尹天舒
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1