【技术实现步骤摘要】
一种语音流采样率确定方法及装置
本专利技术涉及语音信息识别
,特别涉及一种语音流采样率确定方法及装置。
技术介绍
语音识别技术已经在诸多领域有应用,一般来说,语音识别需要庞大的计算资源,因此复杂的语音识别系统几乎都搭建在大型服务器集群上,通过客户端发送语音流在服务器上进行识别。语音流是由语音数据构成,对于常见的WAV、MP3格式的语音流,在每一段语音的头部均带有该段语音的各项特征,包括采样率,但是对于类似pcm格式的语音流,并无头部数据,即不包含语音的采样率等信息,可视为纯数据流,而采样率作为语音识别中最为核心的参数之一,发挥着重要作用,只有输入正确的采样率,语音识别系统才可以有效的识别语音。目前,对大规模语音流进行语音识别时采样率主要通过以下方式获得:人工标注采样率并输入系统;或者根据特定要求双方约定采样率。这些方式本质上均为人为指定或标注,不仅效率低,还会受到很多人为因素限制,不利于语音识别系统的迁移运用。因此,如何通过无头文件信息的纯语音数据流来判断语音的采样率是大规模语音识别领域中亟待解决的问题。 >专利技术内本文档来自技高网...
【技术保护点】
1.一种语音流采样率确定方法,其特征在于,所述方法包括:/n获取语音流的噪声片段;/n根据预定采样率区间,在所述噪声片段中分别对应所述预定采样率区间中的每一采样率进行第一预定数量数据点随机选取,并计算每一采样率对应的平均过零次数;/n对所述噪声片段进行预定噪声类别匹配,从包括所述预定噪声类别及其对应音频的噪声数据库获得匹配的相应噪声类别音频,并根据所述预定采样率区间,在所述噪声类别音频中分别对应所述预定采样率区间中的每一采样率进行第二预定数量数据点随机选取,并计算每一采样率对应的平均过零次数;/n根据所述噪声片段的每一采样率对应的平均过零次数与所述噪声类别音频的每一采样率对 ...
【技术特征摘要】
1.一种语音流采样率确定方法,其特征在于,所述方法包括:
获取语音流的噪声片段;
根据预定采样率区间,在所述噪声片段中分别对应所述预定采样率区间中的每一采样率进行第一预定数量数据点随机选取,并计算每一采样率对应的平均过零次数;
对所述噪声片段进行预定噪声类别匹配,从包括所述预定噪声类别及其对应音频的噪声数据库获得匹配的相应噪声类别音频,并根据所述预定采样率区间,在所述噪声类别音频中分别对应所述预定采样率区间中的每一采样率进行第二预定数量数据点随机选取,并计算每一采样率对应的平均过零次数;
根据所述噪声片段的每一采样率对应的平均过零次数与所述噪声类别音频的每一采样率对应的平均过零次数,确定所述语音流的采样率。
2.根据权利要求1所述的方法,其特征在于,获取语音流的噪声片段,包括:
切分所述语音流头部和/或尾部的所述第一预定数量的数据点,获得短时噪声数据;其中,所述第一预定数量均不小于所述预定采样率区间中每一采样率下的单位采样数。
3.根据权利要求2所述的方法,其特征在于,所述第一预定数量、第二预定数量均不小于441000。
4.根据权利要求1至3任一项所述的方法,其特征在于,根据预定采样率区间,在所述噪声片段中分别对应所述预定采样率区间中的每一采样率进行相应数据点随机选取,并计算每一采样率对应的平均过零次数,包括:
根据所述预定采样率区间,分别以预定次数从所述噪声片段中的所述第一预定数量数据点中,选取每一采样率对应的每秒采样个数为数量的数据点,然后分别计算所述预定次数中每次的过零次数,再分别计算得到所述噪声片段每一采样率对应的平均过零次数。
5.根据权利要求4所述的方法,其特征在于,根据所述预定采样率区间,在所述噪声类别音频中分别对应所述预定采样率区间中的每一采样率进行第二预定数量数据点随机选取,并计算每一采样率对应的平均过零次数,包括:
根据所述预定采样率区间,分别以所述预定次数从所述噪声类别音频中的所述第二预定数量数据点中,选取每一采样率对应的每秒采样个数为数量的数据点,然后分别计算所述预定次数中每次的过零次数,再分别计算得到所述噪声类别音频每一采样率对应的平均过零次数。
6.根据权利要求1所述的方法,其特征在于,对所述噪声片段进行预定噪声类别匹配,从包括所述预定噪声类别及其对应音频的噪声数据库获得匹配的相应噪声类别音频,包括:
通过预设相似度匹配方法对所述噪声片段进行预定噪声类别匹配,从包括所述预定...
【专利技术属性】
技术研发人员:李铭浩,郑鑫江,倪合强,包飞,黄华,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。