一种语音会议混音系统及方法技术方案

技术编号：15227699 阅读：79 留言：0更新日期：2017-04-27 10:51

本发明专利技术公开了一种语音会议混音系统及方法。系统包括会议混音模块。会议混音模块包含输入语音处理单元、输入语音混音单元。输入语音处理单元将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减，得到每个与会成员当前帧的输入语音差值。输入语音混音单元将当前帧的每个输入语音差值进行逐次叠加，每次叠加得到一个与会成员当前帧的最新混音值。该系统或方法将每个与会成员输入的最新输入语音数据与前一帧输入的语音数据相减，可以有效的去除混音结果的直流分量，避免会议语音信号失真；且设计简单、占用资源少、成本低。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音会议通信
，尤其涉及语音会议混音系统及方法。
技术介绍
现有的通信设备中，实现会议混音功能主要有两种实现方式。一种是通过CPU或DSP实现混音；一种是通过FPGA/CPLD实现混音。通过CPU或DSP实现混音的优点是可能实现更为复杂的混音控制功能。然而，通过CPU或DSP实现混音在相同的会议资源路数时，混音的处理需要占用CPU或DSP的处理时间，更多的会议混音路数要求CPU或DSP在单位时间内能处理更多的指令，从而需要更强的处理器，导致其成本比FPGA/CPLD高出许多。此外，由于CPU或DSP很难做到实时性，所以一般都是基于缓存的语音包处理，而缓存语音包会引入语音的延迟。通过FPGA/CPLD实现混音功能可以在占用很少资源的前提下轻松实现上万路的语音混音，而且语音混音的实时性很强，引入的语音延迟可以忽略。然而，目前通过FPGA/CPLD实现混音的技术实现由于大都采取了线性语音求和的做法，如果多个输入信号含有同极性的直流分量，线性语音求和后会使结果中的直流分量成倍放大，导致语音数据在这个极性方向溢出的概率变大，溢出后语音波形被削顶，语音信号的信噪比降低。此外，在输入语音含有直流分量时会导致混音后的数据含有直流分量。直流分量会使话机扬声器(听筒)不能发挥其最佳性能而导致语音失真。除非输入信号的直流分量相互抵消，否则求和算法并不能去除直流分量，而现实中很难满足这种巧合。为了克服这些缺点，现有的FPGA/CPLD实现混音的技术在混音模块前需要对语音做预处理，混音后还需要后期调节处理，而这些导致更多的资源占用和成本费用。如果多个会议成员所...

【技术保护点】
一种语音会议混音系统，包括会议混音模块，其特征在于：所述会议混音模块包含输入语音处理单元(11)、输入语音混音单元(12)；所述输入语音处理单元(11)将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减，得到每个与会成员当前帧的输入语音差值；所述输入语音混音单元(12)将当前帧的每个输入语音差值进行逐次叠加，每次叠加得到一个与会成员当前帧的最新混音值；当前帧叠加过程中，第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加；所述输入语音混音单元(12)并且将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。

【技术特征摘要】
1.一种语音会议混音系统，包括会议混音模块，其特征在于：所述会议混音模块包含输入语音处理单元(11)、输入语音混音单元(12)；所述输入语音处理单元(11)将每个与会成员的语音输入端口当前帧采集的输入语音数据与前一帧采集的输入语音数据相减，得到每个与会成员当前帧的输入语音差值；所述输入语音混音单元(12)将当前帧的每个输入语音差值进行逐次叠加，每次叠加得到一个与会成员当前帧的最新混音值；当前帧叠加过程中，第一次叠加是前一帧最后一次叠加得到的最新混音值与当前帧第一个待叠加的输入语音差值相加；所述输入语音混音单元(12)并且将当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出。2.根据权利要求1所述的语音会议混音系统，其特征在于：所述会议混音模块还包含输出语音处理单元(13)；所述输出语音处理单元(13)在当前帧每个最新混音值从相应的与会成员的语音输出端口一一输出前，将每个与会成员的最新混音值减去本与会成员的语音输入端口当前帧采集的输入语音数据。3.根据权利要求2所述的语音会议混音系统，其特征在于：所述输入语音处理单元(11)包含输入语音求差部(111)、输入语音存储部(112)；每个与会成员的语音输入端口分别与所述输入语音求差部(111)的第一输入端以及所述输入语音存储部(112)的输入端相连接；所述输入语音存储部(112)的输出端与所述输入语音求差部(111)的第二输入端相连接；所述输入语音求差部(111)的输出端与所述输入语音混音单元(12)的输入端相连接；所述输入语音存储部(112)用于分别对每个与会成员前一帧采集的输入语音数据进行存储；所述输入语音求差部(111)用于将每个与会成员的当前帧采集的输入语音数据与存储在所述输入语音存储部(112)中相应的前一帧采集的输入语音数据进行相减，得到每个与会成员的输入语音差值。4.根...

【专利技术属性】
技术研发人员：李宝勋，曾熙璘，方辉，刘黎，
申请(专利权)人：广州广哈通信股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人