视频数据的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:37960105 阅读:22 留言:0更新日期:2023-06-30 09:35
本发明专利技术涉及视频处理领域,公开了一种视频数据的生成方法、装置、设备及存储介质。该方法包括:获取素材;生成素材的文本描述信息;将文本描述信息映射至预设维度的超平面,得到文本描述向量;将文本描述向量与素材关联保存,得到预设素材库;在接收到语音信息时,根据语音信息以及预设素材库生成视频数据。本发明专利技术降低了视频数据的生成成本。了视频数据的生成成本。了视频数据的生成成本。

【技术实现步骤摘要】
视频数据的生成方法、装置、设备及存储介质


[0001]本专利技术涉及视频处理领域,尤其涉及一种视频数据的生成方法、装置、设备及存储介质。

技术介绍

[0002]在视频生成的领域中,视频生成方式主要是将视频素材与语音素材进行合成。对于视频素材的获取方式,现存手段往往需要人为截取或者选择视频帧,然后再人为选择或者编辑文本素材进行配对,最后将得到的视频帧与文本素材合成,从而得到视频素材。该方式在不付出一定时间成本的情况下,视频帧与文本素材的匹配程度低,若付出一定时间成本,会使得视频数据的生成成本升高。

技术实现思路

[0003]本专利技术的主要目的在于解决视频数据的生成成本高的技术问题。
[0004]本专利技术第一方面提供了一种视频数据的生成方法,所述视频数据的生成方法包括:获取素材;生成所述素材的文本描述信息;将所述文本描述信息映射至预设维度的超平面,得到文本描述向量;将所述文本描述向量与所述素材关联保存,得到所述预设素材库;在接收到语音信息时,根据所述语音信息以及所述预设素材库生成视频数据。
[0005]可选的,在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频数据的生成方法,其特征在于,所述视频数据的生成方法包括:获取素材;生成所述素材的文本描述信息;将所述文本描述信息映射至预设维度的超平面,得到文本描述向量;将所述文本描述向量与所述素材关联保存,得到所述预设素材库;在接收到语音信息时,根据所述语音信息以及所述预设素材库生成视频数据。2.根据权利要求1所述的视频数据的生成方法,其特征在于,所述在接收到语音信息时,根据所述语音信息以及所述预设素材库生成视频数据的步骤包括:在接收到所述语音信息时,获取所述语音信息对应的关键字;将所述关键字映射至所述超平面,得到关键字向量;根据所述关键字向量以及所述文本描述向量在所述预设素材库中确定目标素材;根据所述语音信息以及所述目标素材生成所述视频数据。3.根据权利要求2所述的视频数据的生成方法,其特征在于,所述在接收到所述语音信息时,获取所述语音信息对应的关键字的步骤包括:在接收到所述语音信息时,对所述语音信息进行语音识别,得到语音文本信息;根据TF

IDF算法对所述语音文本信息进行关键字提取,得到所述关键字。4.根据权利要求2所述的视频数据的生成方法,其特征在于,所述根据所述语音信息以及所述目标素材生成所述视频数据的步骤包括:根据CTC模型识别所述关键字在所述语音信息中的起始时间点与结束时间点;根据所述起始时间点与所述结束时间点剪辑所述目标素材,得到待配音素材;将所述语音信息与所述待配音素材合成,得到所述视频数据。5.根据权利要求1所述的视频数据的生成方法,其特征在于,所述生成所述素材的文本描述信息的步骤包括:将所述素材输...

【专利技术属性】
技术研发人员:蔡卓君阮霁阳
申请(专利权)人:上海积图科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1