【技术实现步骤摘要】
一种处理视频字幕的方法、装置、终端及存储介质
[0001]本专利技术属于计算机
,尤其涉及一种处理视频字幕的方法、处理视频字幕的装置、处理视频字幕的终端及存储介质。
技术介绍
[0002]随着互联网视频内容的不断增加,如何在海量视频中检索出所需要的视频显得至关重要。传统的基于关键词描述的视频检索由于描述能力有限、主观性强等原因,已经不能满足海量视频检索的需求,现有技术中,通过识别、翻译视频中的字幕,得到反映视频内容的文本信息,通过这些文本信息实现视频的检索。
[0003]然而,要识别、翻译视频中的字幕,首先需要检测到字幕在视频中的位置。在现有的视频字幕定位方法中,直接对视频图像进行文字识别,导致提取到视频图像中大量的背景文字,进而导致不能得到准确的视频字幕区域。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供了一种处理视频字幕的方法、处理视频字幕的装置、处理视频字幕的终端及存储介质,以解决现有的视频字幕定位方法直接对视频图像进行文字识别,导致提取到视频图像中大量的背景文字,进而导致不能 ...
【技术保护点】
【技术特征摘要】
1.一种处理视频字幕的方法,其特征在于,包括:获取待处理视频对应的目标图像;所述目标图像为根据所述待处理视频中的多个视频帧所确定的;确定所述目标图像的文字边缘特征;确定所述目标图像的轮廓特征;根据所述文字边缘特征和所述轮廓特征,确定所述目标图像对应的视频字幕区域。2.如权利要求1所述的方法,其特征在于,所述目标图像包括所述待处理视频中的多个视频帧,或包括对所述多个视频帧进行图像融合处理后得到的融合图像。3.如权利要求2所述的方法,其特征在于,所述待处理视频包含N个视频帧,N为大于1的整数,当所述目标图像包括对所述多个视频帧进行图像融合处理后得到的融合图像时,所述获取待处理视频对应的目标图像,包括:将第i帧视频帧对应的融合图像与第i+1帧视频帧进行图像融合处理,得到第i+1帧视频帧对应的融合图像;其中,第i帧视频帧对应的融合图像由第i
‑
1帧视频帧对应的融合图像与第i帧视频帧进行图像融合处理得到的,i的取值为2,3...N
‑
1,第1帧视频帧对应的融合图像为第1帧视频帧本身;当i为N
‑
1时,第i+1帧视频帧对应的融合图像为所述待处理视频对应的目标图像。4.如权利要求1所述的方法,其特征在于,所述根据所述文字边缘特征和所述轮廓特征,确定所述目标图像对应的视频字幕区域,包括:对所述文字边缘特征和所述轮廓特征进行特征融合处理,得到交叉边缘特征;对所述交叉边缘特征进行形态学操作,得到二值图像;对所述二值图像进行孔洞填充处理,得到所述视频字幕区域。5.如权利要求1所述的方法,其特征在于,所述确定所述目标图像的文字边缘特征,包括:将所述目标图像输入到已训练的特征提取模型中处理,得到所述目标图像对应的文字边缘特征;所述特征提取模型基于初始特征提取网络对样本图像集进行训练得到;所述样本图像集包括多个样本图像以及每个样本图像对应的文字边缘特征。6.如权利要求1所述的方法,其特征在于,所述确定所述目标图像的轮廓特征,包括:对所述目标图像进行降噪...
【专利技术属性】
技术研发人员:林染染,张传昊,刘阳兴,
申请(专利权)人:武汉TCL集团工业研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。