语音数据识别的方法、生成会议纪要的方法及相关装置制造方法及图纸

技术编号:38946759 阅读:12 留言:0更新日期:2023-09-25 09:43
本申请实施例公开了一种语音数据识别的方法及相关装置,该方法用于提高模板库中音频数据的特征的准确性,以提高语音数据识别的准确度。本申请实施例方法包括:根据模板库以及第一音频数据的特征确定第一音频数据的类别,模板库中包含N条音频数据的特征以及,N条音频数据的特征与N条音频数据的类别的对应关系,其中,N为正整数;当第一音频数据满足目标条件时,将第一音频数据的特征添加至模板库中第一音频数据的类别下。音频数据的类别下。音频数据的类别下。

【技术实现步骤摘要】
语音数据识别的方法、生成会议纪要的方法及相关装置


[0001]本申请实施例涉及人工智能
,尤其涉及一种语音数据识别的方法及相关装置。

技术介绍

[0002]随着智能语音技术的不断发展,智能会议的概念被提出,会议中最重要的功能就是会议纪要。智能会议纪要,主要用到的技术包括语音识别(ASR)、说话人分割(speaker diralization)、语音活动检测(VAD)等技术。
[0003]智能会议纪要的主要功能包括识别每个人说话的内容并转换为文字、对每段文字标注说话人身份等,该功能也可以概括为将会议中的语音数据的类别进行识别,每个类别代表一个人。
[0004]在实际中,智能会议纪要面对的场景复杂,受到说话人数、重叠说话、说话风格、交谈环境等影响较大,所以如何保证智能会议纪要中语音数据识别的准确性,是亟需解决的重要问题。

技术实现思路

[0005]本申请实施例提供了一种评分方法及相关装置,用于对用户的回复内容进行评分,以准确地考核员工。
[0006]第一方面,本申请提供了一种音频数据识别的方法,包括:
[0007]根据模板库以及第一音频数据的特征确定第一音频数据的类别,第一音频数据可以是任意一段待识别的音频数据,第一音频数据的特征可以是第一音频数据的声纹特征,该声纹特征可以采用向量表示;模板库中包含N条音频数据的特征以及,N条音频数据的特征与N条音频数据的类别的对应关系,模板库中的音频数据的特征也可以是声纹特征,该声纹特征可以采用向量表示,其中,N为正整数;当第一音频数据满足目标条件时,将第一音频数据的特征添加至模板库中第一音频数据的类别下,目标条件可以,目标条件可以根据需要进行设定,例如可以根据第一音频数据的信噪比、第一音频数据的混响情况等进行设定,以保证加入模板库中的第一音频数据的质量。
[0008]当满足目标条件时,才将第一音频数据的特征以及第一音频数据与第一音频数据的类别的对应关系加入模板库,使得加入模板库的音频数据的特征都可以用来准确地识别音频数据的类别,以防止质量较差的音频数据的特征影响后续音频数据的识别,降低累积误差的影响。
[0009]作为一种可实现的方式,方法还包括:根据第一音频数据的信噪比、第一音频数据的混响情况,以及第一音频数据的特征与K条音频数据的特征的相似度中的至少一者,确定第一音频数据满足目标条件,其中,K条音频数据属于N条音频数据,且K条音频数据的类别与第一音频数据的类别相同,K为正整数。
[0010]信噪比是正常声音信号与信号噪声信号比值,第一音频数据的信噪比越高,则说
明第一音频数据的质量越好;混响可以理解为声音经多次反射后混合,若第一音频数据存在混响,说明第一音频数据的质量较差;第一音频数据的特征与K条音频数据的特征的相似度越高,则说明第一音频数据的特征与K条音频数据的特征越接近,基于此,便可以采用第一音频数据的特征与K条音频数据的特征,对同一类别的音频数据进行识别。
[0011]通过上述参数可以保证,加入模板库的音频数据的特征能够用来准确地识别音频数据的类别,以防止质量较差的音频数据的特征影响后续音频数据的识别,降低累积误差的影响。
[0012]作为一种可实现的方式,方法还包括:根据聚类算法对模板库中的音频数据的特征进行聚类处理;聚类算法,又称聚类分析、群分析,它是研究(样品或指标)识别问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类算法的种类有很多,该实施例采用谱聚类算法进行聚类处理。聚类处理可以是周期性地进行,例如,每5min进行一次聚类处理。
[0013]通过聚类算法可以剔除模板库中与其他特征的相似度较低的个别特征,以实现对模板库中特征的矫正,防止误差累积,从而提高模板库中音频数据的特征的准确性,进一步保证了音频数据识别的准确性。
[0014]作为一种可实现的方式,第一音频数据是由目标音频数据分离得到的,目标音频数据还分离得到第二音频数据;第一音频数据的采集时间和第二音频数据的采集时间存在相同的部分,这也可以理解为,目标音频数据中存在重叠的音频数据。例如,第一音频数据是人物AA在第0s至第5s发出的语音数据,第二音频数据是人物BB在第3s至第8s发出的语音数据,这意味着目标音频数据在第3s至第5s内存在重叠的音频数据。目标音频数据可以是由麦克风采集到任意音频数据,通常情况下,目标音频数据包含多个人的音频数据。可以采用多种方法对目标音频数据进行分离,例如,可以采用Beamforming技术或基于深度学习的盲源分离方法对目标音频数据进行分离。
[0015]将目标音频数据分离,得到第一音频数据和第二音频数据,然后单独对第一音频数据进行识别,避免了直接对目标音频数据中重叠部分的音频数据进行识别,造成错误地将多个人的语音数据划分为一个类别的情况,从而保证了第一音频数据识别的准确性。
[0016]作为一种可实现的方式,方法还包括:根据模板库以及第二音频数据的特征确定第二音频数据的类别,第二音频数据的类别的确定方法与第一音频数据的类别的确定方法类似。
[0017]单独对第二音频数据进行识别,避免了直接对目标音频数据中重叠部分的音频数据进行识别,造成错误地将多个人的语音数据划分为一个类别的情况,从而保证了第一音频数据识别的准确性。
[0018]作为一种可实现的方式,方法还包括:根据第一音频数据的类别和第二音频数据的类别,对目标音频数据进行标记,使得目标音频数据中重叠部分的音频数据能够同时获得第一音频数据的类别和第二音频数据的类别的标记,保证了标记的准确性。
[0019]作为一种可实现的方式,方法还包括:向终端发送经过标记的目标音频数据,以使得终端显示经过标记的目标音频数据。
[0020]第二方面,本申请提供了一种音频数据识别的方法,包括:根据模板库以及第一音频数据的特征确定第一音频数据的类别,第一音频数据可以是任意一段待识别的音频数
据,第一音频数据的特征可以是第一音频数据的声纹特征,该声纹特征可以采用向量表示;模板库中包含N条音频数据的特征以及,N条音频数据的特征与N条音频数据的类别的对应关系,模板库中的音频数据的特征也可以是声纹特征,该声纹特征可以采用向量表示,其中,N为正整数;根据聚类算法对模板库中的音频数据的特征进行聚类处理;聚类算法,又称聚类分析、群分析,它是研究(样品或指标)识别问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类算法的种类有很多,该实施例采用谱聚类算法进行聚类处理。聚类处理可以是周期性地进行,例如,每5min进行一次聚类处理。另外,聚类处理可以在确定第一音频数据的类别前执行,也可以在确定第一音频数据的类别后执行。
[0021]通过聚类算法可以剔除模板库中与其他特征的相似度较低的个别特征,以实现对模板库中特征的矫正,防止误差累积,从而提高模板库中音频数据的特征的准确性,进一步保证了音频数据识别的准确性。
[0022]第三方面,本申请提供了一种生成会议纪要的方法,采用如第一方面中任意一项的方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据识别的方法,其特征在于,包括:根据模板库以及第一音频数据的特征确定所述第一音频数据的类别,所述模板库中包含N条音频数据的特征以及,所述N条音频数据的特征与N条音频数据的类别的对应关系,其中,N为正整数;当所述第一音频数据满足目标条件时,将所述第一音频数据的特征添加至所述模板库中所述第一音频数据的类别下。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第一音频数据的信噪比、所述第一音频数据的混响情况,以及所述第一音频数据的特征与K条音频数据的特征的相似度中的至少一者,确定所述第一音频数据满足所述目标条件,其中,所述K条音频数据属于所述N条音频数据,且所述K条音频数据的类别与所述第一音频数据的类别相同,K为正整数。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据聚类算法对所述模板库中的所述音频数据的特征进行聚类处理。4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述第一音频数据是由目标音频数据分离得到的,所述目标音频数据还分离得到第二音频数据;所述第一音频数据的采集时间和所述第二音频数据的采集时间存在相同的部分。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述模板库以及第二音频数据的特征确定所述第二音频数据的类别。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:根据所述第一音频数据的类别和所述第二音频数据的类别,对所述目标音频数据进行标记。7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述方法还包括:向终端发送经过标记的所述目标音频数据,以使得所述终端显示经过标记的所述目标音频数据。8.一种生成会议纪要的方法,其特征在于,采用如权利要求1至7中任意一项所...

【专利技术属性】
技术研发人员:王保辉芦宇李卓龙王迎迎胡伟湘罗田锋
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1