当前位置: 首页 > 专利查询>武汉大学专利>正文

基于高斯混合模型的感知域音频编码方法及系统技术方案

技术编号:9991734 阅读:221 留言:0更新日期:2014-05-02 06:40
本发明专利技术公开了一种基于高斯混合模型的感知域音频编码方法和系统,包括步骤:步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进听觉行阈值判别;步骤4,采用多路复用掩蔽模型替换子带信号谱包络;步骤5,采用采用高斯-牛顿算法对子带信号谱包络进行高斯混合模型参数拟合;步骤6,量化和编码拟合后的高斯混合模型参数。本发明专利技术可应用于高质量的中低码率语音编码,能大大降低编码码率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于高斯混合模型的感知域音频编码方法和系统,包括步骤:步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进听觉行阈值判别;步骤4,采用多路复用掩蔽模型替换子带信号谱包络;步骤5,采用采用高斯-牛顿算法对子带信号谱包络进行高斯混合模型参数拟合;步骤6,量化和编码拟合后的高斯混合模型参数。本专利技术可应用于高质量的中低码率语音编码,能大大降低编码码率。【专利说明】基于高斯混合模型的感知域音频编码方法及系统
本专利技术涉及感知域音频编码领域,尤其涉及一种基于高斯混合模型的感知域音频编码方法及系统。
技术介绍
随着计算机技术、网络技术和通信技术的飞速发展,人类社会已经进入了数字化时代。一些重要信号,如语音、音乐、影视的数字化版本,数据量巨大,传输和存储成本较高。而且,随着新技术和新应用的不断出现,还有可能出现数码率更高的信源。这些数据的传输和存储便是一个很大的难题,而编码技术正是针对这一问题而提出的解决办法。在这些应用中,音频编码技术作为其中的关键技术之一起到了极大的推动作用。人类听觉系统存在局限性,不能感知所接收到的声音中的所有信号成分。传统的感知域音频编码方法将音频信号变换到感知域后,会产生大量的冗余脉冲信号,编码效率不高。
技术实现思路
本专利技术的目的是提供一种基于高斯混合模型的感知域音频编码方法及系统,使得编码后的音频信号码率更低。为达到上述目的,本专利技术提出了一种基于高斯混合模型的感知域音频编码方法,包括步骤:步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进行听觉阈值判别,去除小于绝对掩蔽阈值的子带信号谱包络,保留不小于掩蔽阈值的子带信号谱包络,以便有效减少子带信号脉冲数量;步骤4,采用多路复用掩蔽模型替换步骤3所得子带信号谱包络,使用多路复用掩蔽模型的目的主要有两个:一方面为了进一步减少子带信号脉冲数量从而有利于编码的实施,另一方面为了更好重构音频信号;步骤5,采用高斯混合模型参数分别表示各子带信号谱包络,基于步骤4所得子带信号谱包络构建高斯混合模型,并采用高斯-牛顿算法拟合高斯混合模型参数;步骤6,对步骤5所得高斯混合模型参数进行量化和编码。 步骤4进一步包括子步骤:4.1针对当前原始子带信号样本,找出子带信号谱包络的最大值,计算最大值所在的子带信号谱包络产生的掩蔽效应图形,所述的当前原始子带信号样本初始值为步骤3所得子带信号谱包络;4.2将当前原始子带信号样本与掩蔽效应图形中对应的样本点值进行比较,并根据比较结果获得替换后的子带信号谱包络:若当前原始子带信号样本点值大于掩蔽效应图形中相应样本点值,则保留该当前原始子带信号样本点;若当前原始子带信号样本点值不大于掩蔽效应图形中相应样本点值,则将该当前原始子带信号样本点值替换为掩蔽效应图形中相应样本点值;所述的样本点值指样本点处谱包络的幅度值;4.3以替换后的子带信号谱包络为当前原始子带信号样本,然后执行步骤4.1~4.2,直至当前原始子带信号样本中所有样本点值均被掩蔽效应图形中相应样本点值替换过、或均进行过至少两次样本点值比较,即完成子带信号谱包络替换。步骤5进一步包括子步骤:5.1定义拟合算式【权利要求】1.基于高斯混合模型的感知域音频编码方法,其特征在于,包括步骤: 步骤I,采用听觉滤波器对输入音频信号进行滤波,获得子带信号; 步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络; 步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进行听觉阈值判别,去除小于绝对掩蔽阈值的子带信号谱包络,保留不小于掩蔽阈值的子带信号谱包络; 步骤4,采用多路复用掩蔽模型替换步骤3所得子带信号谱包络; 步骤5,采用高斯混合模型参数分别表示各子带信号谱包络,基于步骤4所得子带信号谱包络构建高斯混合模型,并采用高斯-牛顿算法拟合高斯混合模型参数; 步骤6,对步骤5所得高斯混合模型参数进行量化和编码。2.如权利要求1所述的基于高斯混合模型的感知域音频编码方法,其特征在于: 步骤4进一步包括子步骤: 4.1针对当前原始子带信号样本,找出子带信号谱包络的最大值,计算最大值所在的子带信号谱包络产生的掩蔽效应图形; 4.2将当前原始子带信号样本与掩蔽效应图形中对应的样本点值进行比较,并根据比较结果获得替换后的子带信号谱包络: 若当前原始子带信号样本点值大于掩蔽效应图形中相应样本点值,则保留该原始子带信号样本点;若当前原始子带信号样本点值不大于掩蔽效应图形中相应样本点值,则将该当前原始子带信号样本点值替换为掩蔽效应图形中相应样本点值;所述的样本点值指样本点处谱包络的幅度值; 4.3以替换后的子带信号谱包络为当前原始子带信号样本,然后执行步骤4.1~4.2,直至当前原始子带信号样本中所有样本点值均被掩蔽效应图形中相应样本点值替换过、或均进行过至少两次样本点值比较,即完成子带信号谱包络替换。3.如权利要求1所述的基于高斯混合模型的感知域音频编码方法,其特征在于: 步骤5进一步包括子步骤: ` 5.1定义拟合算式 4.如权利要求1所述的基于高斯混合模型的感知域音频编码方法,其特征在于: 步骤6中,采用均匀量化方式对高斯混合模型参数中的均值和方差进行量化,采用非均匀量化方式对高斯混合模型参数中的权值进行量化。5.基于高斯混合模型的感知域音频编码系统,其特征在于,包括: 听觉滤波器组模块,用来采用听觉滤波器对输入音频信号进行滤波,获得子带信号;包络平滑模块,用来提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络; 听觉阈值判别模块,用来采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进行听觉阈值判别,删除小于绝对掩蔽阈值的子带信号谱包络,保留不小于绝对掩蔽阈值的子带信号谱包络; 掩蔽模型替换模块,用来采用多路复用掩蔽模型替换子带信号谱包络; 高斯混合模型拟合模块,用来采用高斯混合模型参数分别表示各子带信号谱包络,基于子带信号谱包络构建高斯混合模型,并采用高斯-牛顿算法拟合高斯混合模型参数;量化编码模块,用来对高斯混合模型参数进行量化和编码。6.如权利要求5所述的基于高斯混合模型的感知域音频编码系统,其特征在于: 所述的听觉滤波器组模块为ga_atone滤波器组模块。7.如权利要求5所述的基于高斯混合模型的感知域音频编码系统,其特征在于: 所述的量化编码模块进一步包括均匀量化模块、非均匀量化模块和差分编码模块,均匀量化模块用来对高斯混合模型参数中的均值和方差进行量化,非均匀量化模块用来对高斯混合模型参数中的权值进行量化。【文档编号】G10L19/04GK103761969SQ201410057260【公开日】2014年4本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:高戈陈怡吕亚平张康杨玉红
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1