字幕逐字显示方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:36605361 阅读:18 留言:0更新日期:2023-02-04 18:26
本申请公开了一种字幕逐字显示方法、装置、电子设备及可读存储介质,所述字幕逐字显示方法包括:从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标,其中,所述文字检测模型是根据已完成字幕区域标注的图片训练得到;根据各所述字幕区域坐标提取各图像帧中的文字,得到包含时间戳的各字符串构成的字符串队列;依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。本申请解决了字幕逐字显示文本的准确度低的技术问题。显示文本的准确度低的技术问题。显示文本的准确度低的技术问题。

【技术实现步骤摘要】
字幕逐字显示方法、装置、电子设备及可读存储介质


[0001]本申请涉及显示
,尤其涉及一种字幕逐字显示方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着人们娱乐方式不断丰富,越来越多的人选择在闲暇之余去唱歌来放松娱乐,而MV(Music Video,音乐视频)中的歌词显示则是唱歌者进行语速控制以及节奏把控的重要方式。目前在MV视频中的歌词显示中的逐字显示文本主要是基于对目标MV视频中的歌词字幕颜色进行OCR(optical character recognition,光学符号识别)识别得到的。这种基于颜色识别的方法只保留了原歌词字幕的颜色特征,而文字部分的特征则被简化,所以对所述目标MV视频中的歌词字幕识别提取文字特征偏少,与对应的时间不匹配,从而导致生成的字幕逐字显示文本的准确度偏低。

技术实现思路

[0003]本申请的主要目的在于提供一种字幕逐字显示方法、电子设备及计算机可读存储介质,旨在解决字幕逐字显示文本的准确度低的技术问题。
[0004]为实现上述目的,本申请提供一种字幕逐字显示方法,所述字幕逐字显示方法包括:
[0005]从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标,其中,所述文字检测模型是根据已完成字幕区域标注的图片训练得到;
[0006]根据各所述字幕区域坐标提取各图像帧中的文字,得到包含时间戳的各字符串构成的字符串队列;
[0007]依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。
[0008]可选地,从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标,其中,所述文字检测模型是根据已完成字幕区域标注的图片训练得到;
[0009]根据各所述字幕区域坐标提取各图像帧中的文字,得到包含时间戳的各字符串构成的字符串队列;
[0010]依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。
[0011]可选地,所述依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示的步骤包括:
[0012]依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,若存
在差异,则将所述字符串与对应的时间戳添加进识别队列;
[0013]对比所述识别队列中的各字符串与对应的前一位字符串,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。
[0014]可选地,所述依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,若存在差异,则将所述字符串与对应的时间戳添加进识别队列的步骤包括:
[0015]将所述字符串队列中的各字符串按对应的时间戳顺序进行排列;
[0016]依次将各所述字符串与对应的前一位字符串进行对比,若所述字符串与前一位字符串不相同,则将所述字符串添加进所述识别队列;
[0017]若所述字符串与前一位字符串相同,则舍弃所述字符串。
[0018]可选地,所述识别队列中的各字符串按对应的时间戳顺序进行排列,所述对比所述识别队列中的各字符串与对应的前一位字符串,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示的步骤包括:
[0019]判断所述前一位字符串是否为所述字符串的子集;
[0020]若是,则判定所述字符串与所述前一位字符串属于同一条字幕,并将所述字符串与所述前一位字符串的差值作为所述字符串对应的字幕逐字识别结果;
[0021]若否,则判定所述字符串与所述前一位字符串不属于同一条字幕,并将所述字符串作为所述字符串对应的字幕逐字识别结果;
[0022]根据各所述字符串对应的时间戳与各所述字幕逐字识别结果,显示各所述字幕逐字识别结果。
[0023]可选地,述从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标的步骤包括:
[0024]从所述目标视频中每隔预设时间段提取一帧图片,得到各所述图像帧;
[0025]通过所述文字检测模型对各所述图像帧的预设区域进行文字检测,得到各所述字幕区域坐标。
[0026]可选地,述从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标的步骤包括:
[0027]从所述目标视频中每隔预设时间段提取一帧图片,得到各所述图像帧;
[0028]通过所述文字检测模型对各所述图像帧的预设区域进行文字检测,得到各所述字幕区域坐标。
[0029]本申请还提供一种字幕逐字显示装置,所述字幕逐字显示装置应用于字幕逐字显示设备,所述字幕逐字显示装置包括:
[0030]区域检测模块,用于从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标,其中,所述文字检测模型是根据已完成字幕区域标注的图片训练得到;
[0031]文字提取模块,用于根据各所述字幕区域坐标提取各图像帧中的文字,得到包含时间戳的各字符串构成的字符串队列;
[0032]识别确定模块,用于依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。
[0033]可选地,所述识别确定模块还用于:
[0034]依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比;
[0035]若所述字符串比所述前一位字符串长,则将所述字符串与所述前一位字符串的差值作为所述字符串对应的字幕逐字识别结果;
[0036]若所述字符串比所述前一位字符串短,则将所述字符串作为所述字符串对应的字幕逐字识别结果;
[0037]若所述字符串与所述前一位字符串相同,则将所述字符串舍弃;
[0038]根据各所述字符串对应的时间戳与各所述字幕逐字识别结果,显示各所述字幕逐字识别结果。
[0039]可选地,所述识别确定模块还用于:
[0040]依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,若存在差异,则将所述字符串与对应的时间戳添加进识别队列;
[0041]对比所述识别队列中的各字符串与对应的前一位字符串,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。
[0042]可选地,所述识别确定模块还用于:
[0043]将所述字符串队列中的各字符串按对应的时间戳顺序进行排列;
[0044]依次将各所述字符串与对应的前一位字符串进行对比,若所述字符串与前一位字符串不相同,则将所述字符本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字幕逐字显示方法,其特征在于,所述字幕逐字显示方法包括:从目标视频中提取各图像帧,通过文字检测模型检测各所述图像帧中的字幕区域,得到各字幕区域坐标,其中,所述文字检测模型是根据已完成字幕区域标注的图片训练得到;根据各所述字幕区域坐标提取各图像帧中的文字,得到包含时间戳的各字符串构成的字符串队列;依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。2.如权利要求1所述字幕逐字显示方法,其特征在于,所述依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示的步骤包括:依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比;若所述字符串比所述前一位字符串长,则将所述字符串与所述前一位字符串的差值作为所述字符串对应的字幕逐字识别结果;若所述字符串比所述前一位字符串短,则将所述字符串作为所述字符串对应的字幕逐字识别结果;若所述字符串与所述前一位字符串相同,则将所述字符串舍弃;根据各所述字符串对应的时间戳与各所述字幕逐字识别结果,显示各所述字幕逐字识别结果。3.如权利要求1所述字幕逐字显示方法,其特征在于,所述依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示的步骤包括:依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,若存在差异,则将所述字符串与对应的时间戳添加进识别队列;对比所述识别队列中的各字符串与对应的前一位字符串,确定字幕逐字识别结果,并根据所述字幕逐字识别结果与对应的时间戳进行字幕逐字显示。4.如权利要求3所述字幕逐字显示方法,其特征在于,所述依次将所述字符串队列中的各所述字符串与对应的前一位字符串进行对比,若存在差异,则将所述字符串与对应的时间戳添加进识别队列的步骤包括:将所述字符串队列中的各字符串按对应的时间戳顺序进行排列;依次将各所述字符串与对应的前一位字符串进行对比,若所述字符串与前一位字符串不相同,则将所述字符串添加进所述识别队列;若所述字符串与前一位字符串相同,则舍弃所述字符串。5.如权利要求3所述字幕逐字显示方法,其特征在于,所述识别队列中的各字符串按对应的时间戳顺序进行排列,所述对比所述识别队列中的各字符串与对应的前一位字符串,确定...

【专利技术属性】
技术研发人员:马哲刘剑
申请(专利权)人:北京云水客科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1