The invention provides a data generation method and device, which includes: generating multiple virtual person models and multiple voice models corresponding to multiple real-life teachers'images and voices respectively; acquiring multiple target teaching videos belonging to the same target teaching course from multiple real-life teachers' teaching videos; and recognizing targets from any target teaching video of the target teaching course. Many teaching elements of the teaching course, the logical order of execution of multiple teaching elements, the multiple teaching phonetics used by real-life teachers in the teaching process are identified. The multiple teaching phonetics of the target teaching course are obtained. In the target teaching video of the target teaching course, the relationship between multiple teaching phonetics and multiple teaching elements is studied, and the teaching of the target teaching course is generated. The relationship between elements and teaching pronunciation identification.
【技术实现步骤摘要】
数据生成方法及装置
本专利技术涉及人工智能
,特别是涉及一种数据生成方法及装置。
技术介绍
目前的在线教学方式主要是人工教学,即真人老师提供教学内容并控制教学内容的展现来对客户端的学生进行网络教学。但是,真人老师的数量有限,且一个真人老师一般只可以教授一个学科,因此,人工在线教学方案不够灵活。
技术实现思路
本专利技术提供了一种数据生成方法及装置,以解决相关技术中人工在线教学方案所存在的教学方法灵活性差的问题。为了解决上述问题,根据本专利技术的一个方面,本专利技术公开了一种数据生成方法,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。根据本专利技术的另一方面,本专利技术还公开了一 ...
【技术保护点】
1.一种数据生成方法,其特征在于,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。
【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述多个真人老师的教学视频分别抽取肢体动作信息;根据所述肢体动作信息,生成分别对应所述多个真人老师肢体动作的多个肢体动作模型;其中,针对任意一个真人老师的肢体动作模型包括教学动作标识与动作参数的对应关系,且在不同真人老师的肢体动作模型之间,同一种教学动作的教学动作标识相同;对所述目标教学课程的所述多个目标教学视频,识别真人老师在教学过程中使用的多个种类的教学动作;学习所述目标教学课程的所述目标教学视频中,所述多个种类的教学动作与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学动作标识之间的关联关系。3.根据权利要求2所述的方法,其特征在于,所述多个肢体动作模型人工标记有不同的风格类型。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对多个真人老师的教学视频分别抽取表情信息;根据所述表情信息,生成分别对应所述多个真人老师表情的多个表情模型;其中,针对任意一个真人老师的表情模型包括教学表情标识与表情参数的对应关系,且在不同真人老师的表情模型之间,同一种教学表情的教学表情标识相同;对所述目标教学课程的所述多个目标教学视频,识别真人老师在教学过程中使用的多个种类的教学表情;学习所述目标教学课程的所述目标教学视频中,所述多个种类的教学表情与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学表情标识之间的关联关系。5.根据权利要求4所述的方法,其特征在于,所述多个表情模型人工标记有不同的表情类型。6.根据权利要求1所述的方法,其特征在于,所述根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型之后,所述方法还包括:根据所述多个虚拟人物模型,分别生成多个人物图像;对所述多个虚拟人物模型,分别配置多个人物图像。7.根据权利要求1所述的方法,其特征在于,所述多个语音模型人工标记有不同的声音类型。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述多个真人老师的性别信息,对所述多个虚拟人物模型和所述多个语音模型分别标记性别信息。9.根据权利要求1所述的方法,其特征在于,所述对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音之后,所述方法还包括:对所述多个教学语音生成男生版本的多个教学语音和女生版本的多个教学语音。10.一种数据生成装置,其特征在于,包括:第一抽取模块,用于对多个真人老师的教学视频分别抽取人物图像信息;第一...
【专利技术属性】
技术研发人员:韩异凡,茹立云,王坚,
申请(专利权)人:北京葡萄智学科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。