课堂中不同声音的区分方法、装置、设备以及存储介质制造方法及图纸

技术编号：34372298 阅读：23 留言：0更新日期：2022-07-31 11:45

本申请涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质，涉及声音分类的技术领域，其方法包括采集课堂声音，将课堂声音输入至训练好的声纹模型中，得到多段声音片段的声纹向量；根据声纹向量，判断与声纹向量对应的声音片段是否为非教师声音；若是，则将声纹向量输入至训练好的声音分类模型中，根据声纹向量，对与声纹向量对应的声音片段进行分类；其中，声音分类模型的训练方法，包括：提取训练样本集中每一个训练样本的梅尔谱特征；将梅尔谱特征转化为二维的梅尔频谱图；将梅尔频谱图输入至声音分类模型中，利用VGG11网络结构对声音分类模型进行训练。本申请具有区分出课堂中的不同声音的效果。课堂中的不同声音的效果。课堂中的不同声音的效果。

Methods, devices, equipment and storage media for distinguishing different sounds in class

全部详细技术资料下载

【技术实现步骤摘要】
课堂中不同声音的区分方法、装置、设备以及存储介质

[0001]本申请涉及声音分类的
，尤其是涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质。

技术介绍

[0002]在课堂中，往往有很多种声音，例如，教师声音、单个学生的声音、多个学生齐读的声音、讨论的声音和噪音等等。在课堂分析过程中，往往需要区分出课堂中这些不同的声音，以便分析课堂中不同的教学行为。
[0003]目前，传统的做法为通过预先采集的教师声音来区分课堂中的不同声音，但是也只是区分出教师声音和非教师声音，并没有区分出单个学生的声音、多个学生齐读的声音、讨论的声音和噪音。

技术实现思路

[0004]为了区分出课堂中的不同声音，本申请提供一种课堂中不同声音的区分方法、装置、设备以及存储介质。
[0005]第一方面，本申请提供一种声音分类模型的训练方法，采用如下的技术方案：
[0006]一种声音分类模型的训练方法，包括：
[0007]将训练样本集中每一个训练样本转化为第一频谱图，所述第一频谱图为二维的梅尔频谱图；
[000本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音分类模型的训练方法，其特征在于，包括：将训练样本集中每一个训练样本转化为第一频谱图，所述第一频谱图为二维的梅尔频谱图；将所述梅尔频谱图输入至所述声音分类模型中，利用VGG11网络结构对所述声音分类模型进行训练。2.一种课堂中不同声音的区分方法，其特征在于，包括：采集课堂声音，将所述课堂声音输入至训练好的声纹模型中，得到多段声音片段的声纹向量；根据所述声纹向量，判断与所述声纹向量对应的声音片段是否为非教师声音；若是，则对与所述声纹向量对应的声音片段进行特征提取,得到第二频谱图，将所述第二频谱图输入至训练好的声音分类模型中，根据所述声纹向量，对与所述声纹向量对应的声音片段进行分类；其中，所述第二频谱图为二维的梅尔频谱图；其中，所述声音分类模型的训练方法，包括：将训练样本集中每一个训练样本转化为第一频谱图，所述第一频谱图为二维的梅尔频谱图；将所述第一频谱图输入至所述声音分类模型中，利用VGG11网络结构对所述声音分类模型进行训练。3.根据权利要求2所述的方法，其特征在于，所述声纹模型的训练方法，包括：获取开源的声音数据集，将预先采集的课堂声音制作为课堂声音数据集，将开源的声音数据集和课堂声音数据集共同作为样本集；将所述样本集中的样本输入至所述声纹模型中，利用深度学习算法对所述声纹模型进行训练。4.根据权利要求2所述的方法，其特征在于，所述采集课堂声音，将所述课堂声音输入至训练好的声纹模型中，得到多段声音片段的声纹向量，包括：将所述课堂声音分割为多段声音片段；对所述多段声音片段分别进行声纹提取，得到所述声纹向量。5.根据权利要求3所述的方法，其特征在于，所述将所述课堂声音分割为多段声音片段，包括：将所述课堂声音划分为多个片段，相邻片段之间具有共有部分和非共有部分；分别计算共有部分与相邻片段的非共有部分的声纹特征匹配度；基于所述声纹特征匹配度，获取切换点；按照所述切换点将所述课堂声音分割为多段声音片段。6.根据权利要求2所述的方法，其特征在于，所述根据所述声纹向量，判断与所述声纹向量对应的声音片段是否为非教师声音，包括：采用BIRTCH聚类算法和Calinski
‑
Harabaz指数结合的方法，基于所述声纹向量进...

【专利技术属性】
技术研发人员：孙德宇，谷娜娜，
申请(专利权)人：北京中庆现代技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人