一种语音会议混音系统及方法技术方案

技术编号:15227699 阅读:79 留言:0更新日期:2017-04-27 10:51
本发明专利技术公开了一种语音会议混音系统及方法。系统包括会议混音模块。会议混音模块包含输入语音处理单元、输入语音混音单元。输入语音处理单元将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员当前帧的输入语音差值。输入语音混音单元将当前帧的每个输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值。该系统或方法将每个与会成员输入的最新输入语音数据与前一帧输入的语音数据相减,可以有效的去除混音结果的直流分量,避免会议语音信号失真;且设计简单、占用资源少、成本低。

【技术实现步骤摘要】

本专利技术涉及语音会议通信
,尤其涉及语音会议混音系统及方法。
技术介绍
现有的通信设备中,实现会议混音功能主要有两种实现方式。一种是通过CPU或DSP实现混音;一种是通过FPGA/CPLD实现混音。通过CPU或DSP实现混音的优点是可能实现更为复杂的混音控制功能。然而,通过CPU或DSP实现混音在相同的会议资源路数时,混音的处理需要占用CPU或DSP的处理时间,更多的会议混音路数要求CPU或DSP在单位时间内能处理更多的指令,从而需要更强的处理器,导致其成本比FPGA/CPLD高出许多。此外,由于CPU或DSP很难做到实时性,所以一般都是基于缓存的语音包处理,而缓存语音包会引入语音的延迟。通过FPGA/CPLD实现混音功能可以在占用很少资源的前提下轻松实现上万路的语音混音,而且语音混音的实时性很强,引入的语音延迟可以忽略。然而,目前通过FPGA/CPLD实现混音的技术实现由于大都采取了线性语音求和的做法,如果多个输入信号含有同极性的直流分量,线性语音求和后会使结果中的直流分量成倍放大,导致语音数据在这个极性方向溢出的概率变大,溢出后语音波形被削顶,语音信号的信噪比降低。此外,在输入语音含有直流分量时会导致混音后的数据含有直流分量。直流分量会使话机扬声器(听筒)不能发挥其最佳性能而导致语音失真。除非输入信号的直流分量相互抵消,否则求和算法并不能去除直流分量,而现实中很难满足这种巧合。为了克服这些缺点,现有的FPGA/CPLD实现混音的技术在混音模块前需要对语音做预处理,混音后还需要后期调节处理,而这些导致更多的资源占用和成本费用。如果多个会议成员所处的环境接近,从而背景噪声相似,简单的线性语音求和的做法,会使背景噪声成倍放大,导致信噪比降低。
技术实现思路
针对现有技术的不足,本专利技术提出了一种语音会议混音系统及方法,该系统或方法使用差值混音求和算法,在FPGA/CPLD上通过分时复用的流水线的方式,完成几十路至上万路语音的会议混音功能,延迟小,且能有效的去除输入信号的直流分量,提高音频信噪比;在不降低混音质量的前提下,解决了现有技术设计复杂、占用资源多、成本高的问题。为了实现上述目的,本专利技术技术方案如下:一种语音会议混音系统,包括会议混音模块。会议混音模块包含输入语音处理单元、输入语音混音单元。输入语音处理单元将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员当前帧的输入语音差值。输入语音混音单元将当前帧的每个输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值;当前帧叠加过程中,第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加;输入语音混音单元并且将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。进一步地,会议混音模块还包含输出语音处理单元。输出语音处理单元在当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出前,将每个与会成员的最新混音值减去本与会成员的语音输入端口当前帧采集的输入语音数据。进一步地,输入语音处理单元包含输入语音求差部、输入语音存储部。每个与会成员的语音输入端口分别与输入语音求差部的第一输入端、输入语音存储部的输入端相连接。输入语音存储部的输出端与输入语音求差部的第二输入端相连接。输入语音求差部的输出端与输入语音混音单元的输入端相连接。输入语音存储部用于将每个与会成员前一帧采集的输入语音数据分别进行存储。输入语音求差部用于采用分时复用的方式逐一将每个与会成员的当前帧采集的输入语音数据与存储在输入语音存储部中相应的前一帧采集的输入语音数据进行相减,得到每个与会成员的输入语音差值。进一步地,输入语音混音单元包含输入语音叠加部、混音存储部。输入语音处理单元的输出端与输入语音叠加部的第一输入端相连接。输入语音叠加部的输出端与输出语音处理单元的输出端相连接。并且,输入语音叠加部的输出端与混音存储部的输入端相连接。混音存储部的输出端与输入语音叠加部的第二输入端相连接。进一步地,输入语音混音单元还包含混音滤波部。输入语音叠加部的输出端经过混音滤波部与混音存储部的输入端相连接。进一步地,该系统包括多个相互并行的会议混音模块。进一步地,会议混音模块有多个。前级的会议混音模块的若干语音输出端口作为后级的会议混音模块的语音输入端口。一种语音会议混音方法,包括步骤:将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员当前帧的输入语音差值。将当前帧的每个输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值;当前帧叠加过程中,第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加。将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。进一步地,在当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出前,将每个与会成员的最新混音值减去本与会成员的语音输入端口当前帧采集的输入语音数据。本专利技术的有益效果:(1)该系统或方法将每个与会成员输入的最新输入语音数据与前一帧输入的语音数据相减,可以有效的去除混音结果的直流分量,避免会议语音信号失真;且设计简单、占用资源少、成本低。(2)该系统或方法将会议中混音后的语音信号分别减去各与会成员的输入语音差值,使得各与会成员的语音输出端口只发出其余会议成员的声音,消除了自身输入语音的回音干扰。(3)该系统对各与会成员语音差值进行逐次叠加,每叠加一次的得到的混音值存储到混音存储部中,最后叠加得到的最新混音值存储到混音存储部前,首先经过混音滤波部滤波,消除直流分量。(4)该系统采用并行的方式、级联的方式或者混合的方式将多个会议混音模块进行组合,实现了扩容;并且组合简单、成本低。附图说明图1为本专利技术中系统的会议混音模块的原理示意图。图2为本专利技术中系统的并行式扩容的原理示意图。图3为本专利技术中系统的级联式扩容的原理示意图。图4为本专利技术中系统的混合式扩容的原理示意图。图5为本专利技术中方法的流程示意图。其中,图1至图5的附图标记为:输入语音处理单元11、输入语音混音单元12、输出语音处理单元13;输入语音求差部111、输入语音存储部112;输入语音叠加部121、混音存储部122、混音滤波部123。具体实施方式下面结合附图和实施例,进一步阐述本专利技术。实施例1如图1所示,一种语音会议混音系统,包括会议混音模块。会议混音模块对若干个与会成员的语音数据进行处理。每个与会议成员包括话筒、听筒,话筒的讲话声音占用一个语音输入端口,其听筒的输出语音对应一个语音输出端口。会议混音模块包含输入语音处理单元11、输入语音混音单元12、输出语音处理单元13。输入语音处理单元11、输入语音混音单元12、输出语音处理单元13顺次连接。输入语音处理单元11分别接收每个与会成员语音输入端口的最新输入语音数据;并采用分时复用的方式逐一将每个与会成员的当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员的输入语音差值。输入语音混音单元12将输入语音处理单元11输出的当前帧每个与会成员的输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值;当前帧叠本文档来自技高网
...

【技术保护点】
一种语音会议混音系统,包括会议混音模块,其特征在于:所述会议混音模块包含输入语音处理单元(11)、输入语音混音单元(12);所述输入语音处理单元(11)将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员当前帧的输入语音差值;所述输入语音混音单元(12)将当前帧的每个输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值;当前帧叠加过程中,第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加;所述输入语音混音单元(12)并且将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。

【技术特征摘要】
1.一种语音会议混音系统,包括会议混音模块,其特征在于:所述会议混音模块包含输入语音处理单元(11)、输入语音混音单元(12);所述输入语音处理单元(11)将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减,得到每个与会成员当前帧的输入语音差值;所述输入语音混音单元(12)将当前帧的每个输入语音差值进行逐次叠加,每次叠加得到一个与会成员当前帧的最新混音值;当前帧叠加过程中,第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加;所述输入语音混音单元(12)并且将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。2.根据权利要求1所述的语音会议混音系统,其特征在于:所述会议混音模块还包含输出语音处理单元(13);所述输出语音处理单元(13)在当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出前,将每个与会成员的最新混音值减去本与会成员的语音输入端口当前帧采集的输入语音数据。3.根据权利要求2所述的语音会议混音系统,其特征在于:所述输入语音处理单元(11)包含输入语音求差部(111)、输入语音存储部(112);每个与会成员的语音输入端口分别与所述输入语音求差部(111)的第一输入端以及所述输入语音存储部(112)的输入端相连接;所述输入语音存储部(112)的输出端与所述输入语音求差部(111)的第二输入端相连接;所述输入语音求差部(111)的输出端与所述输入语音混音单元(12)的输入端相连接;所述输入语音存储部(112)用于分别对每个与会成员前一帧采集的输入语音数据进行存储;所述输入语音求差部(111)用于将每个与会成员的当前帧采集的输入语音数据与存储在所述输入语音存储部(112)中相应的前一帧采集的输入语音数据进行相减,得到每个与会成员的输入语音差值。4.根...

【专利技术属性】
技术研发人员:李宝勋曾熙璘方辉刘黎
申请(专利权)人:广州广哈通信股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1