【技术实现步骤摘要】
课堂中不同声音的区分方法、装置、设备以及存储介质
[0001]本申请涉及声音分类的
,尤其是涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质。
技术介绍
[0002]在课堂中,往往有很多种声音,例如,教师声音、单个学生的声音、多个学生齐读的声音、讨论的声音和噪音等等。在课堂分析过程中,往往需要区分出课堂中这些不同的声音,以便分析课堂中不同的教学行为。
[0003]目前,传统的做法为通过预先采集的教师声音来区分课堂中的不同声音,但是也只是区分出教师声音和非教师声音,并没有区分出单个学生的声音、多个学生齐读的声音、讨论的声音和噪音。
技术实现思路
[0004]为了区分出课堂中的不同声音,本申请提供一种课堂中不同声音的区分方法、装置、设备以及存储介质。
[0005]第一方面,本申请提供一种声音分类模型的训练方法,采用如下的技术方案:
[0006]一种声音分类模型的训练方法,包括:
[0007]将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图 ...
【技术保护点】
【技术特征摘要】
1.一种声音分类模型的训练方法,其特征在于,包括:将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图;将所述梅尔频谱图输入至所述声音分类模型中,利用VGG11网络结构对所述声音分类模型进行训练。2.一种课堂中不同声音的区分方法,其特征在于,包括:采集课堂声音,将所述课堂声音输入至训练好的声纹模型中,得到多段声音片段的声纹向量;根据所述声纹向量,判断与所述声纹向量对应的声音片段是否为非教师声音;若是,则对与所述声纹向量对应的声音片段进行特征提取,得到第二频谱图,将所述第二频谱图输入至训练好的声音分类模型中,根据所述声纹向量,对与所述声纹向量对应的声音片段进行分类;其中,所述第二频谱图为二维的梅尔频谱图;其中,所述声音分类模型的训练方法,包括:将训练样本集中每一个训练样本转化为第一频谱图,所述第一频谱图为二维的梅尔频谱图;将所述第一频谱图输入至所述声音分类模型中,利用VGG11网络结构对所述声音分类模型进行训练。3.根据权利要求2所述的方法,其特征在于,所述声纹模型的训练方法,包括:获取开源的声音数据集,将预先采集的课堂声音制作为课堂声音数据集,将开源的声音数据集和课堂声音数据集共同作为样本集;将所述样本集中的样本输入至所述声纹模型中,利用深度学习算法对所述声纹模型进行训练。4.根据权利要求2所述的方法,其特征在于,所述采集课堂声音,将所述课堂声音输入至训练好的声纹模型中,得到多段声音片段的声纹向量,包括:将所述课堂声音分割为多段声音片段;对所述多段声音片段分别进行声纹提取,得到所述声纹向量。5.根据权利要求3所述的方法,其特征在于,所述将所述课堂声音分割为多段声音片段,包括:将所述课堂声音划分为多个片段,相邻片段之间具有共有部分和非共有部分;分别计算共有部分与相邻片段的非共有部分的声纹特征匹配度;基于所述声纹特征匹配度,获取切换点;按照所述切换点将所述课堂声音分割为多段声音片段。6.根据权利要求2所述的方法,其特征在于,所述根据所述声纹向量,判断与所述声纹向量对应的声音片段是否为非教师声音,包括:采用BIRTCH聚类算法和Calinski
‑
Harabaz指数结合的方法,基于所述声纹向量进...
【专利技术属性】
技术研发人员:孙德宇,谷娜娜,
申请(专利权)人:北京中庆现代技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。