数据生成方法及装置制造方法及图纸

技术编号:20798797 阅读:41 留言:0更新日期:2019-04-06 12:28
本发明专利技术提供了一种数据生成方法及装置,该方法包括:生成分别对应多个真人老师形象、语音的多个虚拟人物模型、多个语音模型;获取多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对目标教学课程的任意一个目标教学视频,识别目标教学课程的多个教学元素、识别多个教学元素的执行逻辑顺序、识别真人老师在教学过程中使用的多个教学语音,得到目标教学课程的多个教学语音,并学习目标教学课程的目标教学视频中,多个教学语音与多个教学元素之间的关联关系,生成目标教学课程的教学元素与教学语音标识之间的关联关系。

Data Generation Method and Device

The invention provides a data generation method and device, which includes: generating multiple virtual person models and multiple voice models corresponding to multiple real-life teachers'images and voices respectively; acquiring multiple target teaching videos belonging to the same target teaching course from multiple real-life teachers' teaching videos; and recognizing targets from any target teaching video of the target teaching course. Many teaching elements of the teaching course, the logical order of execution of multiple teaching elements, the multiple teaching phonetics used by real-life teachers in the teaching process are identified. The multiple teaching phonetics of the target teaching course are obtained. In the target teaching video of the target teaching course, the relationship between multiple teaching phonetics and multiple teaching elements is studied, and the teaching of the target teaching course is generated. The relationship between elements and teaching pronunciation identification.

【技术实现步骤摘要】
数据生成方法及装置
本专利技术涉及人工智能
,特别是涉及一种数据生成方法及装置。
技术介绍
目前的在线教学方式主要是人工教学,即真人老师提供教学内容并控制教学内容的展现来对客户端的学生进行网络教学。但是,真人老师的数量有限,且一个真人老师一般只可以教授一个学科,因此,人工在线教学方案不够灵活。
技术实现思路
本专利技术提供了一种数据生成方法及装置,以解决相关技术中人工在线教学方案所存在的教学方法灵活性差的问题。为了解决上述问题,根据本专利技术的一个方面,本专利技术公开了一种数据生成方法,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。根据本专利技术的另一方面,本专利技术还公开了一种数据生成装置,包括:第一抽取模块,用于对多个真人老师的教学视频分别抽取人物图像信息;第一生成模块,用于根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;第二抽取模块,用于对多个真人老师的教学视频或教学音频分别抽取教学语音信息;第二生成模块,用于根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;第七获取模块,用于获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;第一识别模块,用于对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;第二识别模块,用于对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;第三识别模块,用于对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;第一学习模块,用于学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。与现有技术相比,本专利技术包括以下优点:本专利技术实施例的数据生成方法,基于多个真人老师的教学视频或教学音频,构建能够描述多个真人老师形象的多个虚拟人物模型,以及能够模拟多个真人老师声音的多个声音模型,实现了对在线教学中的虚拟人物在形象、声音两个维度的模拟;并且,通过对属于同一个目标教学课程的多个目标教学视频中任意一个目标教学视频,识别多个教学元素、所述多个教学元素之间的展现逻辑顺序,以及对目标教学课程的教学音频或者任意一个目标教学视频识别真人老师在讲授该目标教学课程时所说的话,即多个教学语音;以及对该目标教学课程的上述目标教学视频中,所述多个教学语音以及所述多个教学元素之间的关联关系进行学习,从而生成该目标教学课程的教学元素与教学语音标识之间的关联关系。使得本专利技术还可以对真人老师教学的目标教学课程的课程内容进行虚拟。由于将用于教学的虚拟人物老师从形象、声音两个维度虚拟成两种模型,从而可以对属于不同真人老师的这两个维度的模型进行自由组合,从而提升在线教学过程中对老师形象和声音的组合灵活性;并且,由于将虚拟人物与虚拟人物在线教学的课程内容进行了拆分,使得二者相互独立,从而可以将不同的虚拟人物与不同的课程内容进行灵活组合,提升了老师与课程内容之间的组合灵活性,使得教学方法的灵活性得到显著提高。附图说明图1是本专利技术的一种虚拟人物教学系统实施例的结构框图;图2是本专利技术的一种虚拟人物教学方法实施例的步骤流程图;图3是本专利技术的一种数据生成方法实施例的步骤流程图;图4是本专利技术的一种数据生成装置实施例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的一种虚拟人物教学系统实施例的结构框图。该教学系统包括虚拟老师模型库、教学内容库、虚拟老师教学播放器和用户行为分析器。参照图2,示出了本专利技术的一种虚拟人物教学方法实施例的步骤流程图,结合图1所示的教学系统,这里对本专利技术实施例的教学方法做详细阐述,如图2所示,该方法具体可以包括如下步骤:步骤101,在预先配置的多个虚拟人物模型、多个语音模型、多个肢体动作模型、多个表情模型中,对待教学的客户端配置目标虚拟人物模型、目标语音模型、目标肢体动作模型、目标表情模型;其中,多个肢体动作模型和多个表情模型均为预先配置的可选模型。如图1所示,虚拟老师模型库包括形象模型库、声音模型库、动作模型库和表情模型库。其中,形象模型库包括多个虚拟人物模型,声音模型库包括多个语音模型,动作模型库包括多个肢体动作模型,表情模型库包括多个表情模型。对于任意一个真人老师,本专利技术实施例的方法都可以预先对该老师的教学视频(其中,该教学视频为包括真人老师在线教学影像的视频)进行信息抽取,从而得到对应该真人老师的虚拟人物模型、语音模型、肢体动作模型和表情模型。由于不同真人老师的形象(包括面部特征、发型、穿着风格等)、声音、教学时常用的肢体动作、教学时常用的特殊表情都存在差异,因此,本专利技术实施例预先从这四方面进行信息抽取,从而得到能够表现该真人老师的四方面特征的四个模型(即虚拟人物模型、语音模型、肢体动作模型和表情模型)。由于虚拟老师模型库中预先配置了多个真人老师的虚拟人物模型、语音模型、肢体动作模型和表情模型,那么为了满足待教学的客户端的用户侧对虚拟老师的个性化需求,可以在上述虚拟老师模型库的四种模型库中分别灵活地选择,供待教学的客户端使用的虚拟老师的四个模型(即目标虚拟人物模型、目标语音模型、目标肢体动作模型和目标表情模型)。其中,步骤101的执行主体可以是图1所示的用户行为分析器,也可以是虚拟老师教学播放器。当执行主体为用户行为分析器时,则本专利技术实施例的虚拟老师教学播放器可以从用户行为分析器处获取到对该待教学的客户端配置的四个目标模型;而当执行主体为虚拟老师教学播放器时,则本专利技术实施例的虚拟老师教学播放器则可以对该待教学的客户端配置四个目标模型。步骤102,获取针对待学习目标教学课程的预先配置的多个教学元素、多个教学语音、所述多个教学元素之间的预设展现逻辑顺序、教学元素与教学语音标识之间的关联关系、教学元素与教学动作标识之间的关联关系、教学元素与教学表情标识之间的关联关系;其中,由于上述多个肢体动作模型以及多个表情模型均为可选模型,因此,这里的目标教学课程的教学元素与教学动作标识之间本文档来自技高网...

【技术保护点】
1.一种数据生成方法,其特征在于,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。

【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:对多个真人老师的教学视频分别抽取人物图像信息;根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型;对多个真人老师的教学视频或教学音频分别抽取教学语音信息;根据所述教学语音信息,生成分别对应所述多个真人老师语音的多个语音模型;获取所述多个真人老师的教学视频中,属于同一目标教学课程的多个目标教学视频;对所述目标教学课程的任意一个目标教学视频,识别教学元素,得到所述目标教学课程的多个教学元素;对所述目标教学课程的任意一个目标教学视频,识别所述多个教学元素的执行逻辑顺序,得到所述目标教学课程的所述多个教学元素之间的展现逻辑顺序;对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音,得到所述目标教学课程的多个教学语音;学习所述目标教学课程的所述目标教学视频中,所述多个教学语音与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学语音标识之间的关联关系。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述多个真人老师的教学视频分别抽取肢体动作信息;根据所述肢体动作信息,生成分别对应所述多个真人老师肢体动作的多个肢体动作模型;其中,针对任意一个真人老师的肢体动作模型包括教学动作标识与动作参数的对应关系,且在不同真人老师的肢体动作模型之间,同一种教学动作的教学动作标识相同;对所述目标教学课程的所述多个目标教学视频,识别真人老师在教学过程中使用的多个种类的教学动作;学习所述目标教学课程的所述目标教学视频中,所述多个种类的教学动作与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学动作标识之间的关联关系。3.根据权利要求2所述的方法,其特征在于,所述多个肢体动作模型人工标记有不同的风格类型。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对多个真人老师的教学视频分别抽取表情信息;根据所述表情信息,生成分别对应所述多个真人老师表情的多个表情模型;其中,针对任意一个真人老师的表情模型包括教学表情标识与表情参数的对应关系,且在不同真人老师的表情模型之间,同一种教学表情的教学表情标识相同;对所述目标教学课程的所述多个目标教学视频,识别真人老师在教学过程中使用的多个种类的教学表情;学习所述目标教学课程的所述目标教学视频中,所述多个种类的教学表情与所述多个教学元素之间的关联关系,生成所述目标教学课程的教学元素与教学表情标识之间的关联关系。5.根据权利要求4所述的方法,其特征在于,所述多个表情模型人工标记有不同的表情类型。6.根据权利要求1所述的方法,其特征在于,所述根据所述人物图像信息,生成分别对应所述多个真人老师形象的多个虚拟人物模型之后,所述方法还包括:根据所述多个虚拟人物模型,分别生成多个人物图像;对所述多个虚拟人物模型,分别配置多个人物图像。7.根据权利要求1所述的方法,其特征在于,所述多个语音模型人工标记有不同的声音类型。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述多个真人老师的性别信息,对所述多个虚拟人物模型和所述多个语音模型分别标记性别信息。9.根据权利要求1所述的方法,其特征在于,所述对所述目标教学课程的任意一个目标教学视频或教学音频,识别真人老师在教学过程中使用的多个教学语音之后,所述方法还包括:对所述多个教学语音生成男生版本的多个教学语音和女生版本的多个教学语音。10.一种数据生成装置,其特征在于,包括:第一抽取模块,用于对多个真人老师的教学视频分别抽取人物图像信息;第一...

【专利技术属性】
技术研发人员:韩异凡茹立云王坚
申请(专利权)人:北京葡萄智学科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1