一种快速实现语音信号变速的方法技术

技术编号：3044374 阅读：164 留言：0更新日期：2012-04-11 18:40

一种快速实现语音信号变速的方法，对每一帧语音进行变速处理时，先进行第一级搜索，从输入序列中的分析窗移动范围内的第一个样本点开始按预设步长移动分析窗，搜索到分析窗前Ｗｏｖ个样本点与输出缓存前Ｗｏｖ个样本点相似度最大时的第一同步位置，然后进行第二级搜索，在第一同步位置与相邻的一个或两个移动位置之间逐点移动分析窗，再次搜索到分析窗前Ｗｏｖ个样本点与输出缓存前Ｗｏｖ个样本点相似度最大时的第二同步位置，然后将处于第二同步位置的分析窗前Ｗｏｖ个样本点和输出缓存前Ｗｏｖ个样本点进行叠加，其中，Ｗｏｖ是分析语音与合成语音相叠加部分的长度。本发明专利技术可以大大降低计算复杂度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音技术，尤其涉及。
技术介绍
语音信号变速操作，指的是在不改变基音、音色等特征的前提下，改变信号播放的时间信息。现有多种重要的应用，例如，语言学习机，语音合成，卡拉OK,语音压缩，视频编缉中音视频信号同步等。现有的变速算法可分为两大类一类是基于时域叠接相加技术(OLA, Overlap-Add);另一类是基于频域相位声码器(Phase Vocoder)技术。频域技术使用短时傅里叶变换(STFT， Short time Fourier Transform)，一般适用于音乐信号和大尺度变速，一般来说频域技术通常会引入可感知的相位失真，导致合成后声音不是很自然。时域技术使用叠接相加技术，为了解决叠加时的相位同步问题，通常需要在分析信号或合成信号中搜索一段同叠加部分波形相似的部分。时域同步技术利用了语音信号的准周期性特征，可以得到高质量的合成语音。但时域技术通常适用于小尺度变速。常见的时域技术有同步叠接相加技术(SOLA, Synchronized Overlap-Add),基音同步叠接相加技术(PSOLA, Pitch Synchronized Overlap-Add),波形相似叠接相加技术(WSOLA, Waveform Similarity Overlap-Add)。下面介绍一下采用WSOLA技术的语音信号变速方法，先介绍一下几个重要参数，请同时参照图1:W:分析信号窗长度，表示了接受处理的语音信号的长度。Sa:输入信号帧长，表示了按帧依次截取并进行处理的分析信号的帧长。Ss:输出信号帧长。表示了按帧依次输出的合成...

【技术保护点】
一种快速实现语音信号变速的方法，包括以下步骤：　　　　对每一帧语音进行变速处理时，先进行第一级搜索，从输入序列中的分析窗移动范围内的第一个样本点开始按预设步长移动分析窗，搜索到分析窗前Ｗｏｖ个样本点与输出缓存前Ｗｏｖ个样本点相似度最大时的第一同步位置，然后进行第二级搜索，在第一同步位置与相邻的一个或两个移动位置之间逐点移动分析窗，再次搜索到分析窗前Ｗｏｖ个样本点与输出缓存前Ｗｏｖ个样本点相似度最大时的第二同步位置，然后将处于第二同步位置的分析窗前Ｗｏｖ个样本点和输出缓存前Ｗｏｖ个样本点进行叠加，其中，Ｗｏｖ是分析语音与合成语音相叠加部分的长度。

【技术特征摘要】
1、一种快速实现语音信号变速的方法，包括以下步骤对每一帧语音进行变速处理时，先进行第一级搜索，从输入序列中的分析窗移动范围内的第一个样本点开始按预设步长移动分析窗，搜索到分析窗前Wov个样本点与输出缓存前Wov个样本点相似度最大时的第一同步位置，然后进行第二级搜索，在第一同步位置与相邻的一个或两个移动位置之间逐点移动分析窗，再次搜索到分析窗前Wov个样本点与输出缓存前Wov个样本点相似度最大时的第二同步位置，然后将处于第二同步位置的分析窗前Wov个样本点和输出缓存前Wov个样本点进行叠加，其中，Wov是分析语音与合成语音相叠加部分的长度。2、如权利要求l所述的方法，其特征在于，所述两级搜索过程包括依序执行的以下步骤在范围[O, Kmax]内，以d为搜索的预设步长移动分析窗，在每一个移动位置，计算分析窗前Wov个点和输出序列前Wov个点之间的归一化互相关系数《，Kmax是分析窗移动量的最大值；从上一步计算出的值中，选出最大值对应的第一同步位置Lm;在以Lm为中心位置，间距为d的范围(Lm-d， Lm+d)内逐点移动分析窗，并在每一个移动位置;t计算《值，其中Lm等于O时，0<k<d， Lm等于 Kmax时，Kmax-d<k《Kmax，在其它情况下，Lm-d<k<Lm+d;从上一步计算出的值中，选出《最大值对应的第二同步位置Km。3、如权利要求2所述的方法，其特征在于对第m个语音帧，在移动量为yt的每一移动位置，0《y^《max，先判断计算出的输入序列和输出序列的互相关值《[/fc]为正还是为负，只计算《[W为正时的所述归一化互相关系数的平方(i^[A])2;从得到的所有(i :[yt])2值中选出一个最大值，做第一级搜索时，该最大值对应的移动位置即为所述第一同步位置，做第二级搜索时，该最大值对应的移动位置即为所述第二同步位置；在进行所述叠加时，将分析窗前Wov个样本点与输出緩存前Wov个样本点直4矣进4亍力口4又...

【专利技术属性】
技术研发人员：冯宇红，张晨，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人