音频数据标注方法、装置、电子设备及存储介质制造方法及图纸

技术编号：20871203 阅读：18 留言：0更新日期：2019-04-17 10:19

本发明专利技术涉及语音技术领域，公开了一种音频数据标注方法、装置、电子设备及存储介质，所述方法包括：获取音频数据；提取音频数据的声纹特征；根据声纹特征对音频数据进行聚类，将音频数据划分为至少一个簇；给同一个簇中的音频数据标注上同一用户标识。本发明专利技术实施例提供的技术方案，使得整个标注过程无需人工介入，实现了自动化标注音频数据，避免了人工标注错误率较高的问题，提高了音频数据标注的准确性，无需投入大量的人力，且能够24小时不间断的进行标注，提高了标注效率、降低成本。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据标注方法、装置、电子设备及存储介质
本专利技术涉及语音
，尤其涉及一种音频数据标注方法、装置、电子设备及存储介质。
技术介绍
声纹深度学习模型的训练需要用到大量标注有用户标识的音频数据。目前，对音频数据进行标注的方法主要有两种，一是通过录音设备录制指定人员的音频数据，二是由人工对采集的音频数据进行标注。第一种方法需要雇用专门的人员录制音频数据，成本高效率低，而且无法获取到足够多不同用户的音频数据，难以满足模型训练的需要。第二种方法同样需要雇用大量人员对音频数据进行标注，成本高效率低，而且由于每个人对声音的分辨能力不同，因此人工标注的方式无法保证标注的准确性。因此，现有的音频数据标注方法准确性低、成本高、效率低。
技术实现思路
本专利技术实施例提供一种音频数据标注方法、装置、电子设备及存储介质，以解决现有技术中音频数据标注方法准确性低、成本高、效率低的问题。第一方面，本专利技术一实施例提供了一种音频数据标注方法，包括：获取音频数据；提取音频数据的声纹特征；根据声纹特征对音频数据进行聚类，将音频数据划分为至少一个簇；给同一个簇中的音频数据标注上同一用户标识。第二方面，本专利技术一实施例提供了一种音频数据标注装置，包括：数据获取模块，用于获取音频数据；声纹特征提供模块，用于提取音频数据的声纹特征；聚类模块，用于根据声纹特征对音频数据进行聚类，将音频数据划分为至少一个簇；标注模块，用于给同一个簇中的音频数据标注上同一用户标识。第三方面，本专利技术一实施例提供了一种电子设备，包括收发机、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，收...

【技术保护点】
1.一种音频数据标注方法，其特征在于，包括：获取音频数据；提取所述音频数据的声纹特征；根据所述声纹特征对所述音频数据进行聚类，将所述音频数据划分为至少一个簇；给同一个簇中的音频数据标注上同一用户标识。

【技术特征摘要】
1.一种音频数据标注方法，其特征在于，包括：获取音频数据；提取所述音频数据的声纹特征；根据所述声纹特征对所述音频数据进行聚类，将所述音频数据划分为至少一个簇；给同一个簇中的音频数据标注上同一用户标识。2.根据权利要求1所述的方法，其特征在于，在对所述音频数据进行聚类之前，还包括：将同一音频设备采集的音频数据划分到同一集合中；所述根据所述声纹特征对所述音频数据进行聚类，将所述音频数据划分为至少一个簇，包括：针对同一集合中的音频数据，根据所述声纹特征对所述同一集合中的音频数据进行聚类，将所述同一集合中的音频数据划分为至少一个簇。3.根据权利要求2所述的方法，其特征在于，在根据所述声纹特征对所述音频数据进行聚类之前，还包括：通过预先训练好的性别分类模型确定所述音频数据对应的性别信息；所述将同一音频设备采集的音频数据划分到同一集合中，包括：将同一音频设备采集的性别信息相同的音频数据划分到同一集合中。4.根据权利要求1所述的方法，其特征在于，在提取所述音频数据的声纹特征之前，还包括：通过预先训练好的性别分类模型确定所述音频数据对应的性别信息；所述提取所述音频数据的声纹特征，包括：根据所述音频数据对应的性别信息，选择与所述性别信息对应的声纹特征提取模型提取所述音频数据的声纹特征。5.根据权利要求1至4中任一所述的方法，其特征在于，所述根据所述声纹特征对所述音频数据进行聚类，包括：将每个音频数据作为一个聚类节点，将所述音频数据的声纹特征作为所述聚类节点的声纹特征；根据所述声纹特征对所述聚类节点进行预设次数次第一聚类操作；所述第一聚类操作包括：计算任意两个聚类节点的声纹特征的相似度，针对任一聚类节点，根据所述相似度找到与所述任一聚类节点最相似的聚类节点，若所述任一聚类节点与所述最相似的聚类节点的相似度高于第一聚类阈值，则将所述任一聚类节点与所述最相似的聚类节点合并为一个新的聚类节点，并删除所述任一聚类节点...

【专利技术属性】
技术研发人员：乔登科，
申请(专利权)人：北京猎户星空科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人