文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26798196 阅读:12 留言:0更新日期:2020-12-22 17:15
本发明专利技术提供了文本处理方法、装置、电子设备及存储介质,该方法包括:获取目标帧的视频图像中提取的文本坐标以及与目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;该历史文本坐标与历史帧的视频图像中的文本区域匹配;若目标帧的视频图像中提取的文本坐标和历史文本坐标的误差在阈值范围内,则将历史文本坐标确定为目标文本坐标;若不在阈值范围内,则将目标帧的视频图像中提取的文本坐标确定为目标文本坐标;根据目标文本坐标对目标帧的视频图像进行文本处理。本发明专利技术通过相邻帧的对比对具有波动性的文本坐标进行校正,基于校正后的目标文本坐标进行文本处理,能够提高准确度,降低文本处理过程中出现闪烁不稳定现象的风险。

【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,具体而言,涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
随着电子设备的快速发展,电子设备的功能逐渐完善,人们常使用电子设备获取信息、存储信息和观看视频等。电子设备在播放视频时,在显示视频图像的同时,还可以显示字幕信息,以便于用户理解视频内容。在观看或者使用一些视频时,有相当一部分观众出于不同的原因并不希望在视频中看到字幕,因此,针对这部分群体就有遮挡或者去除字幕的需要。传统的字幕处理方案字体区域识别准确率不高,导致在后续针对字幕的遮挡/去除操作时波动幅度较大,效果不自然,容易出现的闪烁不稳定现象。
技术实现思路
有鉴于此,本专利技术提供一种文本处理方法、装置、电子设备及存储介质,用以提高文本处理的准确度,降低出现的闪烁不稳定现象的风险,获得理想的处理效果。本专利技术实施例的技术方案如下:第一方面,本专利技术提供一种文本处理方法,所述方法包括:获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配;当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内,将所述历史文本坐标确定为目标文本坐标;当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内,将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标;根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。可选地,所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理,包括:获取所述目标帧的视频图像对应的掩模图和遮挡图;所述遮挡图中与所述目标文本坐标匹配的区域具有模糊属性;所述掩模图中与所述目标文本坐标匹配的区域内的像素具有第一像素值;所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值;基于所述掩模图和所述遮挡图对所述目标帧的视频图像进行文本遮挡处理。可选地,所述获取所述目标帧的视频图像对应的掩模图和遮挡图,包括:根据所述目标文本坐标构建所述目标帧的视频图像对应的掩模图;对所述目标帧的视频图像的复制图进行均值模糊,获得所述遮挡图。可选地,所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理,包括:根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域;所述字体区域为字体的轮廓边缘所包围的区域;根据所述至少一个字体区域构建掩模图;所述掩模图中与所述字体区域匹配的区域内的像素具有第一像素值;所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值;基于所述掩模图对所述目标帧的视频图像中的所述至少一个字体区域中进行消除处理。可选地,所述根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域,包括:在所述目标帧的视频图像中与所述目标文本坐标匹配的区域内提取字体颜色数据;所述字体颜色数据用于设定颜色阈值;基于所述颜色阈值对所述目标帧的视频图像进行像素筛选,获得所述至少一个字体区域。可选地,在根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域之后,所述方法还包括:对所述至少一个字体区域进行腐蚀处理和膨胀处理。可选地,在获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标之前,所述方法还包括:通过文本检测网络提取待处理视频内所有帧的视频图像中的文本坐标集;所述文本坐标集中包含所述目标帧的视频图像中提取的文本坐标。可选地,在所述获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标之前,包括:接收用户操作指令,所述用户操作指令用于指示获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标。第二方面,本专利技术提供一种文本处理装置,包括:获取模块、确定模块和处理模块;获取模块,用于获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配;确定模块,用于当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内,将所述历史文本坐标确定为目标文本坐标当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内,将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标;处理模块,用于根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。第三方面,本专利技术提供一种电子设备,所述电子设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该电子设备实现如第一方面所述的文本处理方法。第四方面,本专利技术提供一种存储介质,所述存储介质中存储有机器可执行指令,所述机器可执行指令被执行时实现如第一方面所述的文本处理方法。本专利技术提供一种文本处理方法、装置、电子设备及存储介质,该方法包括:获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配;当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内,将所述历史文本坐标确定为目标文本坐标当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内,将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标;根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。本专利技术与现有技术的区别在于,现有技术在处理目标帧的视频图像时,由于目标帧图像中的提取的文本坐标与真实文本坐标之间可能存在波动,因此直接用提取到的文本坐标进行处理文本,可能会出现处理过渡或者处理不足等不自然现象,因此为了确定目标帧图像中文本的准确的处理区域,首先将目标帧提取的文本坐标与和目标帧相邻的历史帧的文本坐标进行对比,这样可以确定目标帧和历史帧中的文本坐标是否在波动范围内,若是则表明历史帧与目标帧具有同一句话,由于当历史帧为上一个目标帧时,已经对历史帧的文本坐标进行校正,历史帧的文本坐标与文本的真实位置匹配,那么则可以将历史帧的文本坐标作为目标帧图像的目标文本,如果目标帧和历史帧中的文本坐标不在在波动范围内,则表明历史帧与目标帧不具有同一句话,则目标帧中的文本坐标即可以作为目标文本,如此一来,通过相邻帧的对比对具有波动性的文本坐标进行校正,从而可以获得准确的目标文本坐标,基于通过对目标文本坐标表征的区域内的文本进行遮挡或者消除,能够提高准确度,降低在文本处理过程中出现闪烁不稳定现象的风险。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图本文档来自技高网...

【技术保护点】
1.一种文本处理方法,其特征在于,所述方法包括:/n获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配;/n当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内,将所述历史文本坐标确定为目标文本坐标;/n当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内,将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标;/n根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:
获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标;所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配;
当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内,将所述历史文本坐标确定为目标文本坐标;
当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内,将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标;
根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。


2.根据权利要求1所述的文本处理方法,其特征在于,所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理,包括:
获取所述目标帧的视频图像对应的掩模图和遮挡图;所述遮挡图中与所述目标文本坐标匹配的区域具有模糊属性;所述掩模图中与所述目标文本坐标匹配的区域内的像素具有第一像素值;所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值;
基于所述掩模图和所述遮挡图对所述目标帧的视频图像进行文本遮挡处理。


3.根据权利要求2所述的文本处理方法,其特征在于,所述获取所述目标帧的视频图像对应的掩模图和遮挡图,包括:
根据所述目标文本坐标构建所述目标帧的视频图像对应的掩模图;
对所述目标帧的视频图像的复制图进行均值模糊,获得所述遮挡图。


4.根据权利要求1所述的文本处理方法,其特征在于,所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理,包括:
根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域;所述字体区域为字体的轮廓边缘所包围的区域;
根据所述至少一个字体区域构建掩模图;所述掩模图中与所述字体区域匹配的区域内的像素具有第一像素值;所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值;
基于所述掩模图对所述目标帧的视频图像中的所述至少一个字体区域中进行消除处理。


5.根据权利要求4所述的文本处理方法,其特征在于,所述根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域,包括:
在所述目标帧的视频图像中与所述目标文本坐标匹配的区域内提取字体颜色数据;所述...

【专利技术属性】
技术研发人员:华路延
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1