语音字幕合成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33120266 阅读:26 留言:0更新日期:2022-04-17 00:17
本申请提供一种语音字幕合成方法、装置、计算机设备及存储介质,涉及播放资源处理技术领域。该方法包括:通过获取输入文本,创建并在可视化界面中显示每个句子的字幕块,字幕块中显示有每个句子的文本;对每个句子进行语音合成,得到每个句子的语音;将每个句子的语音填充至每个句子的字幕块中,形成每个句子的语音字幕块,语音字幕块中显示有每个句子的文本以及每个句子对应的语音的波形图。通过本申请可使字幕与配音实时同步,提高视频创作或后期制作的效率。作的效率。作的效率。

【技术实现步骤摘要】
语音字幕合成方法、装置、计算机设备及存储介质


[0001]本专利技术涉及播放资源处理
,具体而言,涉及一种语音字幕合成方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,在视频创作或后期制作过程中,需要对视频内容进行配音及添加字幕,现有的视频配音及字幕添加往往是两个独立的不相关的过程,需要分别对视频配音,并添加字幕。
[0003]由于视频配音及字幕是两个独立的过程,当字幕内容更改时,需要同步对配音进行更改。且由于配音及字幕添加之间没有关联,导致字幕与配音不同步,需要不断手动对字幕或配音在视频中的时间进行调整,以保证字幕和配音的同步性。
[0004]但手动调整的字幕时间和配音时间不能完全保持一致,导致字幕与配音无法完全同步,使视频创作或后期制作的效率低,创作内容质量低。

技术实现思路

[0005]本专利技术的目的在于,针对上述现有技术中的不足,提供一种语音字幕合成方法、装置、计算机设备及存储介质,以便使字幕与配音实时同步,提高视频创作或后期制作的效率。
[0006]为实现上述目的,本申请实本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音字幕合成方法,其特征在于,包括:获取输入文本,所述输入文本包括:多个句子;创建并在可视化界面中显示每个句子的字幕块,所述字幕块中显示有所述每个句子的文本;对所述每个句子进行语音合成,得到所述每个句子的语音;将所述每个句子的语音填充至所述每个句子的字幕块中,形成所述每个句子的语音字幕块;所述语音字幕块中显示有:所述每个句子的文本,以及所述每个句子对应的语音的波形图。2.如权利要求1所述的方法,其特征在于,所述对所述每个句子进行语音合成,得到所述每个句子的语音之前,所述方法还包括:响应输入的发音人选择操作,从预设的发音列表中确定目标发音人;所述对所述每个句子进行语音合成,得到所述每个句子的语音,包括:根据所述目标发音人的发音语速,对所述每个句子进行语音合成,得到所述每个句子的语音。3.如权利要求1所述的方法,其特征在于,所述创建并在可视化界面中显示每个句子的字幕块,包括:根据所述每个句子对应的预设字幕块长度,创建并在所述可视化界面中显示所述每个句子的字幕块。4.如权利要求1所述的方法,其特征在于,所述将所述每个句子的语音填充至所述每个句子的字幕块中,形成所述每个句子的语音字幕块之前,所述方法还包括:根据输入针对所述目标发音人的发音语速的确认操作,将所述每个句子的字幕块的长度调节为所述每个句子的语音的长度;所述将所述每个句子的语音填充至所述每个句子的字幕块中,形成所述每个句子的语音字幕块,包括:将所述每个句子的语音填充至长度调节后的所述每个句子的字幕块中,形成所述每个句子的语音字幕块。5.如权利要求1所述的方法,其特征在于,所述将所述每个句子的语音填充至所述每个句子的字幕块中,形成所述每个句子的语音字幕块之前,所述方法还包括:若接收到输入针对所述目标发音人的发音语速的非确认操作,则对所述每个句子的语音进行变速;所述将所述每个句子的语音填充至所述每个句子...

【专利技术属性】
技术研发人员:雷天音
申请(专利权)人:南京亿铭科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1