语音数据识别的方法、生成会议纪要的方法及相关装置制造方法及图纸

技术编号：38946759 阅读：12 留言：0更新日期：2023-09-25 09:43

本申请实施例公开了一种语音数据识别的方法及相关装置，该方法用于提高模板库中音频数据的特征的准确性，以提高语音数据识别的准确度。本申请实施例方法包括：根据模板库以及第一音频数据的特征确定第一音频数据的类别，模板库中包含N条音频数据的特征以及，N条音频数据的特征与N条音频数据的类别的对应关系，其中，N为正整数；当第一音频数据满足目标条件时，将第一音频数据的特征添加至模板库中第一音频数据的类别下。音频数据的类别下。音频数据的类别下。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据识别的方法、生成会议纪要的方法及相关装置

[0001]本申请实施例涉及人工智能
，尤其涉及一种语音数据识别的方法及相关装置。

技术介绍

[0002]随着智能语音技术的不断发展，智能会议的概念被提出，会议中最重要的功能就是会议纪要。智能会议纪要，主要用到的技术包括语音识别(ASR)、说话人分割(speaker diralization)、语音活动检测(VAD)等技术。
[0003]智能会议纪要的主要功能包括识别每个人说话的内容并转换为文字、对每段文字标注说话人身份等，该功能也可以概括为将会议中的语音数据的类别进行识别，每个类别代表一个人。
[0004]在实际中，智能会议纪要面对的场景复杂，受到说话人数、重叠说话、说话风格、交谈环境等影响较大，所以如何保证智能会议纪要中语音数据识别的准确性，是亟需解决的重要问题。

技术实现思路

[0005]本申请实施例提供了一种评分方法及相关装置，用于对用户的回复内容进行评分，以准确地考核员工。
[0006]第一方面，本申请提供了一种音频数据识别的方法，包括：
[0007]根据模板库以及第一音频数据的特征确定第一音频数据的类别，第一音频数据可以是任意一段待识别的音频数据，第一音频数据的特征可以是第一音频数据的声纹特征，该声纹特征可以采用向量表示；模板库中包含N条音频数据的特征以及，N条音频数据的特征与N条音频数据的类别的对应关系，模板库中的音频数据的特征也可以是声纹特征，该声纹特征可以采用向量表示，其中，N为正整数；当第一音频...

【技术保护点】

【技术特征摘要】
1.一种音频数据识别的方法，其特征在于，包括：根据模板库以及第一音频数据的特征确定所述第一音频数据的类别，所述模板库中包含N条音频数据的特征以及，所述N条音频数据的特征与N条音频数据的类别的对应关系，其中，N为正整数；当所述第一音频数据满足目标条件时，将所述第一音频数据的特征添加至所述模板库中所述第一音频数据的类别下。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据所述第一音频数据的信噪比、所述第一音频数据的混响情况，以及所述第一音频数据的特征与K条音频数据的特征的相似度中的至少一者，确定所述第一音频数据满足所述目标条件，其中，所述K条音频数据属于所述N条音频数据，且所述K条音频数据的类别与所述第一音频数据的类别相同，K为正整数。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：根据聚类算法对所述模板库中的所述音频数据的特征进行聚类处理。4.根据权利要求1至3中任意一项所述的方法，其特征在于，所述第一音频数据是由目标音频数据分离得到的，所述目标音频数据还分离得到第二音频数据；所述第一音频数据的采集时间和所述第二音频数据的采集时间存在相同的部分。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：根据所述模板库以及第二音频数据的特征确定所述第二音频数据的类别。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：根据所述第一音频数据的类别和所述第二音频数据的类别，对所述目标音频数据进行标记。7.根据权利要求1至6中任意一项所述的方法，其特征在于，所述方法还包括：向终端发送经过标记的所述目标音频数据，以使得所述终端显示经过标记的所述目标音频数据。8.一种生成会议纪要的方法，其特征在于，采用如权利要求1至7中任意一项所...

【专利技术属性】
技术研发人员：王保辉，芦宇，李卓龙，王迎迎，胡伟湘，罗田锋，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人