自动化教学视频生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31764918 阅读:20 留言:0更新日期:2022-01-05 16:49
本发明专利技术实施例公开了自动化教学视频生成方法、装置、计算机设备及存储介质。所述方法包括:获取来自终端的原始视频;对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签;利用所述视频标签进行若干视频素材文件的自定义组装,形成人物视频素材;获取候选场景;获取来自终端的语音,并存储所述语音至数据库内;从所述数据库内检索并确定待合成的语音;根据所述人物视频素材、候选场景以及待合成的语音进行合成,以得到教学视频。通过实施本发明专利技术实施例的方法可实现满足短周期内大量的教学视频制作,以节约学校和教师在教学视频录制、制作上的工作,减轻教师的工作负担,减少学校的人力资源成本,且可自定义形象和自定义语音。定义语音。定义语音。

【技术实现步骤摘要】
自动化教学视频生成方法、装置、计算机设备及存储介质


[0001]本专利技术涉及视频生成方法,更具体地说是指自动化教学视频生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,人工智能技术已经在开始广泛在各行各业里被应用,以改进传统的技术方案和商业模式。其中,在智能教育领域,以人工智能技术为核心的视频影像合成技术被提出,用来满足广大学生尤其是偏远地区学生对高质量教学视频的需求。现有视频课程的缺点是需要大量的教师通过录制的方式生成完整地课程视频,受限于教师数量和教师工作时间,大量的教学视频无法在短周期内完成录制工作,并且教学视频制作中有大量的后期处理工作,这给教师和学校带来了十分大的时间成本和人力资源成本,而且无法自定义形象和自定义语音。
[0003]因此,有必要设计一种新的方法,实现满足短周期内大量的教学视频制作,以节约学校和教师在教学视频录制、制作上的工作,减轻教师的工作负担,减少学校的人力资源成本,且可自定义形象和自定义语音。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的缺陷,提供自动化教学视频生成方法、装置、计算机设备及存储介质。
[0005]为实现上述目的,本专利技术采用以下技术方案:自动化教学视频生成方法,包括:
[0006]获取来自终端的原始视频;
[0007]对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签;
[0008]利用所述视频标签进行若干视频素材文件的自定义组装,形成人物视频素材;
[0009]获取候选场景;
[0010]获取来自终端的语音,并存储所述语音至数据库内;
[0011]从所述数据库内检索并确定待合成的语音;
[0012]根据所述人物视频素材、候选场景以及待合成的语音进行合成,以得到教学视频。
[0013]其进一步技术方案为:所述对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签,包括:
[0014]对所述原始视频进行分割,以得到若干视频素材文件;
[0015]对若干视频素材文件进行自动化标注,以得到对应的视频标签;
[0016]存储若干视频素材文件以及对应的视频标签。
[0017]其进一步技术方案为:所述对所述原始视频进行分割,以得到若干视频素材文件,包括:
[0018]基于视频人物肢体识别算法,通过计算机视觉技术获得所述原始视频中人物的肢体姿态,以得到人物视频;
[0019]通过聚类算法分割所述人物视频中完整起始状态的视频片段,以得到若干视频素材文件。
[0020]其进一步技术方案为:所述获取候选场景,包括:
[0021]通过文本检索方式获取候选场景。
[0022]其进一步技术方案为:所述候选场景包括二维静态图片、二维动态循环视频、三维静态场景模型以及三维动态场景模型。
[0023]其进一步技术方案为:所述根据所述人物视频素材、候选场景以及待合成的语音进行合成,以得到教学视频,包括:
[0024]基于深度神经网络的GAN技术将所述人物视频素材以及待合成的语音进行合成,以得到目标人物视频;
[0025]将所述目标人物视频与所述候选场景进行合成,以得到教学视频。
[0026]其进一步技术方案为:所述将所述目标人物视频与所述候选场景进行合成,以得到教学视频,包括:
[0027]基于人物抠像技术提取所述目标人物视频内的人物轮廓图像内容,以得到带语音的人物轮廓视频;
[0028]将带语音的人物轮廓视频与所述候选场景进行合成,以得到教学视频。
[0029]本专利技术还提供了自动化教学视频生成装置,包括:
[0030]原始视频获取单元,用于获取来自终端的原始视频;
[0031]处理单元,用于对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签;
[0032]组装单元,用于利用所述视频标签进行若干视频素材文件的自定义组装,形成人物视频素材;
[0033]场景获取单元,用于获取候选场景;
[0034]语音获取单元,用于获取来自终端的语音,并存储所述语音至数据库内;
[0035]语音检索单元,用于从所述数据库内检索并确定待合成的语音;
[0036]教学视频合成单元,用于根据所述人物视频素材、候选场景以及待合成的语音进行合成,以得到教学视频。
[0037]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0038]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
[0039]本专利技术与现有技术相比的有益效果是:本专利技术通过终端获取原始视频以及语音,对原始视频进行处理后再自定义组装,形成人物视频素材,结合候选场景以及自定义的待合成的语音进行合成,以自动生成教学视频,实现满足短周期内大量的教学视频制作,以节约学校和教师在教学视频录制、制作上的工作,减轻教师的工作负担,减少学校的人力资源成本,且可自定义形象和自定义语音。
[0040]下面结合附图和具体实施例对本专利技术作进一步描述。
附图说明
[0041]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本专利技术实施例提供的自动化教学视频生成方法的应用场景示意图;
[0043]图2为本专利技术实施例提供的自动化教学视频生成方法的流程示意图;
[0044]图3为本专利技术实施例提供的自动化教学视频生成方法的子流程示意图;
[0045]图4为本专利技术实施例提供的自动化教学视频生成方法的子流程示意图;
[0046]图5为本专利技术实施例提供的自动化教学视频生成方法的子流程示意图;
[0047]图6为本专利技术实施例提供的自动化教学视频生成方法的子流程示意图;
[0048]图7为本专利技术实施例提供的自动化教学视频生成装置的示意性框图;
[0049]图8为本专利技术实施例提供的自动化教学视频生成装置的处理单元的示意性框图;
[0050]图9为本专利技术实施例提供的自动化教学视频生成装置的分割子单元的示意性框图;
[0051]图10为本专利技术实施例提供的自动化教学视频生成装置的教学视频合成单元的示意性框图;
[0052]图11为本专利技术实施例提供的自动化教学视频生成装置的第二合成子单元的示意性框图;
[0053]图12为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0054]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.自动化教学视频生成方法,其特征在于,包括:获取来自终端的原始视频;对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签;利用所述视频标签进行若干视频素材文件的自定义组装,形成人物视频素材;获取候选场景;获取来自终端的语音,并存储所述语音至数据库内;从所述数据库内检索并确定待合成的语音;根据所述人物视频素材、候选场景以及待合成的语音进行合成,以得到教学视频。2.根据权利要求1所述的自动化教学视频生成方法,其特征在于,所述对所述原始视频进行处理,以形成若干视频素材文件以及对应的视频标签,包括:对所述原始视频进行分割,以得到若干视频素材文件;对若干视频素材文件进行自动化标注,以得到对应的视频标签;存储若干视频素材文件以及对应的视频标签。3.根据权利要求2所述的自动化教学视频生成方法,其特征在于,所述对所述原始视频进行分割,以得到若干视频素材文件,包括:基于视频人物肢体识别算法,通过计算机视觉技术获得所述原始视频中人物的肢体姿态,以得到人物视频;通过聚类算法分割所述人物视频中完整起始状态的视频片段,以得到若干视频素材文件。4.根据权利要求1所述的自动化教学视频生成方法,其特征在于,所述获取候选场景,包括:通过文本检索方式获取候选场景。5.根据权利要求4所述的自动化教学视频生成方法,其特征在于,所述候选场景包括二维静态图片、二维动态循环视频、三维静态场景模型以及三维动态场景模型。6.根据权利要求1所述的自动化教学视频生成方法,其特征在于,所述根据所述人物视频素材、候选场景...

【专利技术属性】
技术研发人员:宋卫卢庆华黄元忠
申请(专利权)人:深圳市木愚科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1