一种音频处理方法、终端设备及系统技术方案

技术编号:8241787 阅读:164 留言:0更新日期:2013-01-24 22:43
本申请实施例公开了一种音频处理方法,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:所述第一终端设备接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;至少将分离出的一个所述独立的音频信息通过一个音频通道输出。应用本申请实施例,通过在终端设备上设置至少两个音频通道,以及对混音音频进行分离,可以实现将一个独立的音频信息通过一个音频通道进行输出播放,由此可以增加单个音频信息的清晰度,便于用户进行分辨。

【技术实现步骤摘要】

本申请涉及语音通信
,特别是涉及一种音频处理方法、终端设备及系统
技术介绍
现有电话会议系统中,包括多个具有麦克的终端设备,这些终端设备接入通信网络中,比如 PSTN(Public Switched Telephone Network,公共交换电话网),IP (InternetProtocol,互联网协议)网络等。以三方电话会议为例,其中一方终端设备只需要提供两条线路就可以把其它两个终端设备联系在一起,实现三方通话。目前最常见的方式是交换机提供三方通话功能,或者运营商提供多方电话会议桥接服务,使得身处不同地方的人能够克服地理位置或距离上困难,同时连接到会议系统中一起说话讨论,彼此能听到对方说话,就好像在同一个屋子里开会一样。 但是,专利技术人在对现有技术的研究过程中发现,对于一方终端设备侧的用户来说,当多个人同时参与会议时,多个语音信息将进行混音后,通过连接线路在终端上进行统一播放,经常有听不清楚的情形,尤其是多个人同时说话的时候,一方面是由于电话线路有信号不好或者干扰等原因,另一方面是发言者距离麦克风的距离不同导致拾入的信号强弱不齐,加上多个人的声音同时响起,要让对方听清楚非常困难,为了解决这个问题,电话会议系统中,会议主持人经常会让单个人发言,但这显然降低了效率。与现场会议不同,现场会议中每个人除了通过识别不同人的音调和音质以外还可以通过声音发出的方位判断所要获取的声音信息,而对于电话会议,所有语音信息统一混音后,接收到该混音信息的终端通过扬声器对其进行统一播放,因此难以听清其中声音较小的语音信息,如果将混音放大,则只能将所有声音同一放大,因此仍然难以分辨单个语音信息。
技术实现思路
本申请实施例提供了一种音频处理方法、终端设备及系统,以解决现有技术中难以分辨混音音频中的单个语音信息,导致收听方分辨效果不佳的问题。为了解决上述技术问题,本申请实施例公开了如下技术方案一种音频处理方法,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;至少将分离出的一个所述独立的音频信息通过一个音频通道输出。所述对混音音频进行分离包括获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。所述对混音音频进行分离后还包括判断分离出的每个独立的音频信息是否为噪音;根据判断结果,将为噪音的音频信息进行过滤。还包括将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。 还包括获取所述混音音频的平均音量;根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。还包括对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;分配用于输出与所述声纹特征对应的音频信息的音频通道。一种终端设备,所述终端设备作为第一终端设备,与至少一个第二终端设备连通,所述第一终端设备具有至少两个音频通道,所述第一终端设备包括接收单元,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;分离单元,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;输出单元,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。所述分离单元包括矩阵获取单元,用于获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;音频分离单元,用于根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。还包括判断单元,用于判断分离出的每个独立的音频信息是否为噪音;过滤单元,用于根据所述判断单元的判断结果,将为噪音的音频信息进行过滤。还包括播放单元,用于将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。还包括获取单元,用于获取所述混音音频的平均音量;调整单元,用于根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。还包括检测单元,用于对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;分配单元,用于分配用于输出与所述声纹特征对应的音频信息的音频通道。一种音频处理系统,包括第一终端设备和与所述第一终端设备连接的至少一个第二终端设备,所述第一终端设备具有至少两个音频通道,所述第一终端设备,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息,对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息,至少将分离出的一个所述独立的音频信息通过一个音频通道输出。由上述实施例可以看出,本申请实施例中第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息,对混音音频进行分离,获得混音音频中的至少一个独立的音频信息,至少将分离出的一个独立的音频信息通过一个音频通道输出。应用本申请实施例,通过在终端设备上设置至少两个音频通道,以及对混音音频进行分离,可以实现将一个独立的音频信息通过一个独 立的音频通道进行输出播放,由此可以增加单个音频信息的清晰度,便于用户进行分辨;进一步,根据分离出的独立音频信息,可以对其进行音量大小的调节,满足用户对不同音频信息的收听需求;并且,虽然传输通道上设置了多个音频通道,但是无需为每个音频通道配置扬声器,而是采用时分复用方式共用扬声器,在保证独立音频信息可以清晰播放的同时,节约了硬件成本。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本申请音频处理方法的第一实施例流程图;图2A为本申请音频处理方法的第二实施例流程图;图2B为图2A中一种混音音频分离的应用场景示意图;图3为本申请首频处理方法的第二实施例流程图;图4为本申请首频处理方法实施例的一种应用场景不意图;图5为本申请终端设备的第一实施例框图;图6为本申请终端设备的第二实施例框图;图7为本申请终端设备的第三实施例框图;图8为本申请终端设备的第四实施例框图;图9为本申请终端设备的第五实施例框图;图10为本申请语音处理系统的实施例框图。具体实施例方式本专利技术如下实施例提供了一种音频处理方法、终端设备及系统。本专利技术实施例中的第一终端设备与至少一个第二终端设备连通,该第一终端设备具有至少两个音频通道。为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术实施例中技术方案作进一步详细的说明。参见图1,为本申请音频处理方法的第一实施例流程图步骤101 :第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音本文档来自技高网
...

【技术保护点】
一种音频处理方法,其特征在于,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;至少将分离出的一个所述独立的音频信息通过一个音频通道输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:李众庆
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利