课堂中不同声音的区分方法、装置、设备以及存储介质制造方法及图纸

技术编号:34372298 阅读:23 留言:0更新日期:2022-07-31 11:45
本申请涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质,涉及声音分类的技术领域,其方法包括采集课堂声音,将课堂声音输入至训练好的声纹模型中,得到多段声音片段的声纹向量;根据声纹向量,判断与声纹向量对应的声音片段是否为非教师声音;若是,则将声纹向量输入至训练好的声音分类模型中,根据声纹向量,对与声纹向量对应的声音片段进行分类;其中,声音分类模型的训练方法,包括:提取训练样本集中每一个训练样本的梅尔谱特征;将梅尔谱特征转化为二维的梅尔频谱图;将梅尔频谱图输入至声音分类模型中,利用VGG11网络结构对声音分类模型进行训练。本申请具有区分出课堂中的不同声音的效果。课堂中的不同声音的效果。课堂中的不同声音的效果。

Methods, devices, equipment and storage media for distinguishing different sounds in class

【技术实现步骤摘要】
课堂中不同声音的区分方法、装置、设备以及存储介质


[0001]本申请涉及声音分类的
,尤其是涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质。

技术介绍

[0002]在课堂中,往往有很多种声音,例如,教师声音、单个学生的声音、多个学生齐读的声音、讨论的声音和噪音等等。在课堂分析过程中,往往需要区分出课堂中这些不同的声音,以便分析课堂中不同的教学行为。
[0003]目前,传统的做法为通过预先采集的教师声音来区分课堂中的不同声音,但是也只是区分出教师声音和非教师声音,并没有区分出单个学生的声音、多个学生齐读的声音、讨论的声音和噪音。

技术实现思路

[0004]为了区分出课堂中的不同声音,本申请提供一种课堂中不同声音的区分方法、装置、设备以及存储介质。
[0005]第一方面,本申请提供一种声音分类模型的训练方法,采用如下的技术方案:
[0006]一种声音分类模型的训练方法,包括:
[0007]将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图
[000本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声音分类模型的训练方法,其特征在于,包括:将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图;将所述梅尔频谱图输入至所述声音分类模型中,利用VGG11网络结构对所述声音分类模型进行训练。2.一种课堂中不同声音的区分方法,其特征在于,包括:采集课堂声音,将所述课堂声音输入至训练好的声纹模型中,得到多段声音片段的声纹向量;根据所述声纹向量,判断与所述声纹向量对应的声音片段是否为非教师声音;若是,则对与所述声纹向量对应的声音片段进行特征提取,得到第二频谱图,将所述第二频谱图输入至训练好的声音分类模型中,根据所述声纹向量,对与所述声纹向量对应的声音片段进行分类;其中,所述第二频谱图为二维的梅尔频谱图;其中,所述声音分类模型的训练方法,包括:将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图;将所述第一频谱图输入至所述声音分类模型中,利用VGG11网络结构对所述声音分类模型进行训练。3.根据权利要求2所述的方法,其特征在于,所述声纹模型的训练方法,包括:获取开源的声音数据集,将预先采集的课堂声音制作为课堂声音数据集,将开源的声音数据集和课堂声音数据集共同作为样本集;将所述样本集中的样本输入至所述声纹模型中,利用深度学习算法对所述声纹模型进行训练。4.根据权利要求2所述的方法,其特征在于,所述采集课堂声音,将所述课堂声音输入至训练好的声纹模型中,得到多段声音片段的声纹向量,包括:将所述课堂声音分割为多段声音片段;对所述多段声音片段分别进行声纹提取,得到所述声纹向量。5.根据权利要求3所述的方法,其特征在于,所述将所述课堂声音分割为多段声音片段,包括:将所述课堂声音划分为多个片段,相邻片段之间具有共有部分和非共有部分;分别计算共有部分与相邻片段的非共有部分的声纹特征匹配度;基于所述声纹特征匹配度,获取切换点;按照所述切换点将所述课堂声音分割为多段声音片段。6.根据权利要求2所述的方法,其特征在于,所述根据所述声纹向量,判断与所述声纹向量对应的声音片段是否为非教师声音,包括:采用BIRTCH聚类算法和Calinski

Harabaz指数结合的方法,基于所述声纹向量进...

【专利技术属性】
技术研发人员:孙德宇谷娜娜
申请(专利权)人:北京中庆现代技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1