文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：26798196 阅读：12 留言：0更新日期：2020-12-22 17:15

本发明专利技术提供了文本处理方法、装置、电子设备及存储介质，该方法包括：获取目标帧的视频图像中提取的文本坐标以及与目标帧相邻的至少一个历史帧的视频图像的历史文本坐标；该历史文本坐标与历史帧的视频图像中的文本区域匹配；若目标帧的视频图像中提取的文本坐标和历史文本坐标的误差在阈值范围内，则将历史文本坐标确定为目标文本坐标；若不在阈值范围内，则将目标帧的视频图像中提取的文本坐标确定为目标文本坐标；根据目标文本坐标对目标帧的视频图像进行文本处理。本发明专利技术通过相邻帧的对比对具有波动性的文本坐标进行校正，基于校正后的目标文本坐标进行文本处理，能够提高准确度，降低文本处理过程中出现闪烁不稳定现象的风险。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
本专利技术涉及数据处理
，具体而言，涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
随着电子设备的快速发展，电子设备的功能逐渐完善，人们常使用电子设备获取信息、存储信息和观看视频等。电子设备在播放视频时，在显示视频图像的同时，还可以显示字幕信息，以便于用户理解视频内容。在观看或者使用一些视频时，有相当一部分观众出于不同的原因并不希望在视频中看到字幕，因此，针对这部分群体就有遮挡或者去除字幕的需要。传统的字幕处理方案字体区域识别准确率不高，导致在后续针对字幕的遮挡/去除操作时波动幅度较大，效果不自然，容易出现的闪烁不稳定现象。
技术实现思路
有鉴于此，本专利技术提供一种文本处理方法、装置、电子设备及存储介质，用以提高文本处理的准确度，降低出现的闪烁不稳定现象的风险，获得理想的处理效果。本专利技术实施例的技术方案如下：第一方面，本专利技术提供一种文本处理方法，所述方法包括：获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标；所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配；当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内，将所述历史文本坐标确定为目标文本坐标；当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内，将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标；根据所述目标文本坐标对所述目标帧的视频图像进行文本处...

【技术保护点】
1.一种文本处理方法，其特征在于，所述方法包括：/n获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标；所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配；/n当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内，将所述历史文本坐标确定为目标文本坐标；/n当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内，将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标；/n根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。/n

【技术特征摘要】
1.一种文本处理方法，其特征在于，所述方法包括：
获取目标帧的视频图像中提取的文本坐标以及与所述目标帧相邻的至少一个历史帧的视频图像的历史文本坐标；所述历史文本坐标与所述历史帧的视频图像中的文本区域匹配；
当所述目标帧的视频图像中提取的文本坐标和所述历史文本坐标的误差在阈值范围内，将所述历史文本坐标确定为目标文本坐标；
当所述目标帧的视频图像中提取的文本坐标与所述历史文本坐标的误差不在阈值范围内，将所述目标帧的视频图像中提取的文本坐标确定为目标文本坐标；
根据所述目标文本坐标对所述目标帧的视频图像进行文本处理。

2.根据权利要求1所述的文本处理方法，其特征在于，所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理，包括：
获取所述目标帧的视频图像对应的掩模图和遮挡图；所述遮挡图中与所述目标文本坐标匹配的区域具有模糊属性；所述掩模图中与所述目标文本坐标匹配的区域内的像素具有第一像素值；所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值；
基于所述掩模图和所述遮挡图对所述目标帧的视频图像进行文本遮挡处理。

3.根据权利要求2所述的文本处理方法，其特征在于，所述获取所述目标帧的视频图像对应的掩模图和遮挡图，包括：
根据所述目标文本坐标构建所述目标帧的视频图像对应的掩模图；
对所述目标帧的视频图像的复制图进行均值模糊，获得所述遮挡图。

4.根据权利要求1所述的文本处理方法，其特征在于，所述根据所述目标文本坐标对所述目标帧的视频图像进行文本处理，包括：
根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域；所述字体区域为字体的轮廓边缘所包围的区域；
根据所述至少一个字体区域构建掩模图；所述掩模图中与所述字体区域匹配的区域内的像素具有第一像素值；所述掩模图中除与所述目标文本坐标匹配的区域的其他区域内的像素具有第二像素值；
基于所述掩模图对所述目标帧的视频图像中的所述至少一个字体区域中进行消除处理。

5.根据权利要求4所述的文本处理方法，其特征在于，所述根据所述目标文本坐标确定所述目标帧的视频图像中的至少一个字体区域，包括：
在所述目标帧的视频图像中与所述目标文本坐标匹配的区域内提取字体颜色数据；所述...

【专利技术属性】
技术研发人员：华路延，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人