一种用于声源分离的编解码方法技术

技术编号:9008252 阅读:153 留言:0更新日期:2013-08-08 03:07
本发明专利技术公开了一种用于声源分离的编解码方法,通过提取实际信号的分布参数并结合心理声学模型,可以在无参考信息或有参考信息的条件下实现音频信号的声源分离,不仅提高了分离后声源的音质而且可以适应广泛的带宽条件,从而提高了声源分离系统的实用性。

【技术实现步骤摘要】

本专利技术涉及多媒体领域,具体涉及一种声源分离技术方案,从单声道、立体声、或者多声道音频信号中分离出独立的声源。
技术介绍
音频信号,特别是音乐信号,通常包含多个声源,例如人声、各个伴奏乐器声、以及环境声。如何有效的从混合的音频信号中提取各个独立的声源是一个重要的理论问题,也是一个重要的应用问题。在卡拉OK中,人声部分需要被部分或完全消除;在移动通话中,环境噪音需要被尽可能的消除以提高通话质量;在主动音乐欣赏(Active Listening ofMusic)中,各个乐器声需要不同的增益和相位调整以合成用户期待的空间音场。在上述应用中,声源分离都是关键性的技术。声源分离系统可以分为两大类,一类是盲声源分离(Blind Source Separation)系统,另一类是有参考信息的声源分离(Informed Source Separation)系统。前者一般仅基于对声源统计特性的基本假设,例如高斯分布或者稀疏分布,而不需要参考信息协助分离声源。后者则需要占据一定带宽(比特率)的参考信息以协助分离声源。盲声源分离系统相对有参考信息的声源分离系统具有更广泛的适应性并且节约带宽,但其缺点是本文档来自技高网...

【技术保护点】
一种用于声源分离的编码方法,其特征在于:对参考信息进行编码,包括获取每个声源和下混信号每个声道的时频变换系数,并按帧和频率排列构成二维时频图;根据活跃声源数遍历每一种活跃声源的组合方案并求得对应的备选解;计算各备选解的失真,取失真最小的备选解所对应的组合的标号作为声源分离的参考信息;根据下混信号判定参考信息的重要性;根据重要性重新组织参考信息;最后对重新组织的参考信息进行熵编码得到参考信息码流。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴钊
申请(专利权)人:湖北文理学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1