The invention provides a complex environment feature mapping method, the feature extraction of speech signal a clean environment; then the speech signal feature extraction in complex environment; then use the feature mapping method for feature mapping of speech signal in complex environments, the characteristics of the map can be viewed as a feature of speech signal clean environment; finally clean speech model environment and has trained under the pattern matching and recognition. The invention uses feature mapping function to map the speech signal under complex environment, the features can be viewed as the characteristics of clean speech signal environment, through the mapping function can make the speech feature in complex environment of purity can be greatly improved so as to enhance speech recognition accuracy, robustness speech recognition system.
【技术实现步骤摘要】
一种复杂环境下语音特征映射方法
本专利技术属于语音信号处理
,特别涉及一种复杂环境下语音特征映射方法。技术背景随着计算机技术的深入发展,模式识别已经成为一种为人类带来巨大便利的实用技术,特别是在人机交互领域。模式识别能够为人机交互提供新的方式,为用户带来更加自然和更有沉浸感的交互体验。而语音识别是模式识别中非常重要的一个模块,在人类自然的交互中,语音交流是最为重要的一种方式,语音识别的运用使得人能够以自然的交互方式与机器进行交互,这种交互方式的便利性可大大缓解人类在人机交互中的压力,丰富了人与机器交互的方式,也使得人机交互更加的丰富和多样。近几十年语音识别已经发展的足够完美,识别率也足够高,然而这些结果都是在实验室内得出的结果,也就是说,在干净环境下,语音识别的结果是足够好的。但是在现实生活中,环境的复杂度是无法估量的,人们几乎不可能保证所身处的环境都是干净的环境,人们的周边充斥着噪音,这些噪音可能是周围自然环境所发出的噪声,也可能是其他人所发出的噪声,也可能是录音设备的噪声。也就是说,语音识别在自然的应用中是处于被噪声包围的复杂环境下的,而语音识别亟需解决的痛点就是在复杂环境下的识别率并不高,甚至是其结果是不被人们所接受的。语音识别的结果受到周围环境的影响,在实验室环境(即干净环境下)其结果足够好,但是在现实环境(即复杂环境)中其结果是不被人们所接受的。这是亟需解决的问题。语音识别的过程包括模型训练和识别两个过程,而模型训练一般使用的都是干净环境下的语音信号,识别过程使用的是复杂环境下即真实的语音信号。要解决这个问题就需要从如何使复杂环境下的语 ...
【技术保护点】
一种复杂环境下语音特征映射方法,其特征在于,包括以下步骤:步骤1:提取干净环境下的语音信号的特征;步骤2:对复杂环境下的语音进行特征提取;步骤3:利用特征映射方法对复杂环境下的语音特征进行映射;步骤4:模式匹配与识别。
【技术特征摘要】
1.一种复杂环境下语音特征映射方法,其特征在于,包括以下步骤:步骤1:提取干净环境下的语音信号的特征;步骤2:对复杂环境下的语音进行特征提取;步骤3:利用特征映射方法对复杂环境下的语音特征进行映射;步骤4:模式匹配与识别。2.根据权利要求1所述的复杂环境下语音特征映射方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:对干净环境下得到的语音信号进行预处理,包括预加重、分帧、加窗;步骤1.2:将步骤1.1中预处理后的信号提取Mel倒谱系数特征;步骤1.3:使用混合高斯模型对步骤1.2中得到的特征建立统计模型,得到干净环境下语音信号的模型Λ。3.根据权利要求1所述的复杂环境下语音特征映射方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:对复杂环境下得到的语音信号进行预处理,包括预加重、分帧、加窗;步骤2.2:将步骤2.1中预处理后的信号提取Mel倒谱系数特征,记为Y=[y1,y2,...,yi,...,yn],yi表示复杂环境下第i帧的语音特征。4.根据权利要求1所述的复杂环境下语音特征映射方法,其特征在于:干净环境下的语音帧数和复杂环境下的语音帧数保持一致。5.根据权利要求2所...
【专利技术属性】
技术研发人员:王志锋,郭天学,左明章,田元,姚璜,
申请(专利权)人:华中师范大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。