【技术实现步骤摘要】
文本擦除方法及装置、电子设备及可读存储介质
[0001]本专利技术涉及图像处理
,特别是涉及文本擦除方法及装置、电子设备及可读存储介质。
技术介绍
[0002]将图像中已有的文本等进行擦除,可以实现该图像的复用等,因此,图像中文本擦除,具有广泛的应用空间。
[0003]目前,主要是先对图像中的文本和非文本进行分割,获得该图像中的文本区域,对该图像中的文本区域进行填充,实现文本擦除。
[0004]然而,现有技术中,对于图像中的文本和非文本分割不够准确,导致文本擦除效果也不够准确。
技术实现思路
[0005]本专利技术实施例的目的在于提供一种文本擦除方法及装置、电子设备及可读存储介质,以实现准确的擦除图像中的文本的技术目的。具体技术方案如下:
[0006]在本专利技术实施的第一方面,首先提供了一种文本擦除方法,所述方法包括:
[0007]获取第一图像中的第一文本区域;
[0008]获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素;
[0009]获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度;
[0010]将所述第一文本区域和各个所述候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;
[0011]对所述第一图像中的所述目标文本区域,进行擦除。
[0012]在 ...
【技术保护点】
【技术特征摘要】
1.一种文本擦除方法,其特征在于,所述方法包括:获取第一图像中的第一文本区域;获取所述第一文本区域对应的至少一个候选文本区域;各个所述候选文本区域,均包含所述第一文本区域中的至少部分像素;获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度;所述区域框选文本置信度,用于表征所述文本区域,框住文本像素的准确程度;将所述第一文本区域和各个所述候选文本区域中,区域框选文本置信度最高的文本区域,确定为目标文本区域;对所述第一图像中的所述目标文本区域,进行擦除。2.根据权利要求1所述的方法,其特征在于,所述获取所述第一文本区域对应的至少一个候选文本区域,包括:对所述第一图像中的第一文本区域进行至少一次扩充,得到所述第一文本区域对应的至少一个候选文本区域;所述候选文本区域的像素,包括所述第一文本区域中的全部像素,且所述候选文本区域的尺寸,大于所述第一文本区域的尺寸。3.根据权利要求1所述的方法,其特征在于,所述获取第一图像中的第一文本区域,包括:采用OCR,获取所述第一图像中的第一文本区域;所述获取所述第一文本区域和各个所述候选文本区域,分别对应的区域框选文本置信度,包括:获取所述第一文本区域的OCR,对应的第一OCR置信度,并将所述第一OCR置信度,确定为所述第一文本区域对应的区域框选文本置信度;分别获取各个所述候选文本区域的OCR,对应的各个第二OCR置信度,并将各个所述第二OCR置信度,分别确定为各个所述候选文本区域对应的区域框选文本置信度。4.根据权利要求3所述的方法,其特征在于,所述获取所述第一文本区域的OCR,对应的第一OCR置信度,包括:将所述第一文本区域对应的子图像,输入预设的OCR卷积神经网络中,得到多组输出结果;每组所述输出结果包括:逻辑回归矩阵和字符识别结果;获取所述多组输出结果所包含的多个字符识别结果中,相同的字符识别结果;将与所述相同的字符识别结果,在同一组输出结果的逻辑回归矩阵,进行归一化处理,得到所述相同的字符识别结果中各个字符对应的各个概率值;将各个所述概率值中最小的概率值,确定为所述第一文本区域的OCR,对应的第一OCR置信度。5.根据权利要求2所述的方法,其特征在于,所述对所述第一图像中的第一文本区域进行至少一次扩充,得到所述第一文本区域对应的至少一个候选文本区域,包括:将所述第一文本区域,在所述第一图像中相互垂直的第一方向和第二方向上,分别向外扩充预设距离,以得到所述第一文本区域对应的至少一个候选文本区域。6.根据权利要求5所述的方法,其特征在于,所述将所述第一文本区域,在所述第一图像中相互垂直的第一方向和第二方向上,分别向外扩充预设距离,以得到所述第一文本区域对应的至少一个候选文本区域,包括:
将所述第一文本区域,在所述第一图像中所述第一方向的两侧上,分别均向外扩充3个第一预设距离,在所述第一图像中所述第二方向的两侧上,分别均向外扩充3个第二预设距离,得到所述第一文本区域对应的9个候选文本区域;所述第一方向为所述第一文本区域的高度所在的方向;所述第二方向为所述第一文本区域的宽度所在的方向。7.根据权利要求6所述的方法,其特征在于,所述3个第一预设距离包括:0.015倍的所述第一文本区域在所述第一方向上的第一尺寸、0.025倍的所述第一尺寸、0.035倍的所述第一尺寸;所述3个第二预设距离包括:0.005倍的所述第一文本区域在所述第二方向上的第二尺寸、0.01倍的所述第二尺寸、0.015倍的所述第二尺寸。8.根据权利要求1所述的方法,其特征在于,所述区域框选文本置信度,与所述文本区域中除了文本像素之外的其他像素的数量成反比;和/或,所述区域框选文本置信度,与所述文本区域漏框的文本像素的数量成反比...
【专利技术属性】
技术研发人员:尹天舒,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。