【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及基于大模型的英语发音教学方法及系统。
技术介绍
1、目前,现有的英语发音教学只能给用户提供标准发音,或者再提供单词场景例句,却不能提供单词场景例句的视频画面,需要用户自行查找,或者人工整理单词场景例句,然而整理单词发音需要抓取海量音视频,需要消耗大量存储空间资源和计算资源从中提取需要的出场景例句画面,使得传统的英语发音教学效率低,用户体验感差。
技术实现思路
1、本专利技术的目的是针对上述现有的相关技术的不足,提出基于大模型的英语发音教学方法及系统,能够提高英语发音教学效率和降低资源消耗,从而提高用户体验感。
2、第一方面,本专利技术提供了一种基于大模型的英语发音教学方法,包括:
3、采集发音教学训练数据,解析所述发音教学训练数据,得到发音音频和所述发音音频对应的发音视频,并抓取所述发音视频中教学发言者的三维面部图像;
4、将所述三维面部图像作为基于生成对抗网络的第一蒸馏模型的输入,进行图像知识蒸馏,输出面部特征,并将所述发
...【技术保护点】
1.一种基于大模型的英语发音教学方法,其特征在于,包括:
2.如权利要求1所述的英语发音教学方法,其特征在于,所述面部特征包括:第一面部特征和第二面部特征;所述第一蒸馏模型包括:基于生成网络的多个第一图像教师模型和基于生成网络的第一图像学生模型;所述将所述三维面部图像作为基于生成对抗网络的第一蒸馏模型的输入,进行图像知识蒸馏,输出面部特征,包括:
3.如权利要求2所述的英语发音教学方法,其特征在于,所述第一蒸馏模型还包括:基于生成网络的第一音频教师模型;所述将所述发音音频输入到所述第一蒸馏模型中进行音频知识蒸馏,输出声音特征,对齐所述声音特征与
...【技术特征摘要】
1.一种基于大模型的英语发音教学方法,其特征在于,包括:
2.如权利要求1所述的英语发音教学方法,其特征在于,所述面部特征包括:第一面部特征和第二面部特征;所述第一蒸馏模型包括:基于生成网络的多个第一图像教师模型和基于生成网络的第一图像学生模型;所述将所述三维面部图像作为基于生成对抗网络的第一蒸馏模型的输入,进行图像知识蒸馏,输出面部特征,包括:
3.如权利要求2所述的英语发音教学方法,其特征在于,所述第一蒸馏模型还包括:基于生成网络的第一音频教师模型;所述将所述发音音频输入到所述第一蒸馏模型中进行音频知识蒸馏,输出声音特征,对齐所述声音特征与所述面部特征的时间轴,得到对齐结果,包括:
4.如权利要求3所述的英语发音教学方法,其特征在于,所述第一蒸馏模型还包括:基于判别网络的第一鉴别模型;所述根据所述对齐结果,获取联合损失函数值,包括:
5.如权利要求4所述的英语发音教学方法,其特征在于,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。