一种网络音频混音处理方法及装置制造方法及图纸

技术编号:20548141 阅读:29 留言:0更新日期:2019-03-09 20:44
本发明专利技术公开一种网络音频混音处理方法及装置,涉及音频处理技术领域,包括:将各路音频数据进行有符号累加;对累加后音频数据进行分段压缩;确定各分段的衰减因子;获取输出的混音音频信号;所述混音处理方法采用分段压缩的方法进行混音,即使得运算效率高,也容易在单片机中实现;通过实际波形观察,得出该方法混音后,并没有溢出及切顶现象,而是都压缩在接近上下限的位置,音量较大,剩余可懂度高,听起来也没有明显噪声干扰;本发明专利技术装置所应用的系统只需要使用ARMCortex

【技术实现步骤摘要】
一种网络音频混音处理方法及装置
本专利技术涉及音频处理
,尤其涉及一种网络音频混音处理方法及装置。
技术介绍
目前,市面上普遍的混音处理方法均采用现有的“归一法混音”,该算法的优点是易于理解,运算表达式简明。但是缺点也很明显,需要使用浮点运算或者将浮点扩展成整形再进行运算,所以运算效率上难以使用单片机去完成;并且当前时刻的混音数据会受到前一时刻的混音数据影响,如果出现丢包的情况。此外,行业上,在会议音频传输中均是使用FPGA+单片机的架构进行传输。例如专利号201010593939.5(一种多媒体数字会议系统),该系统中就是采用FPGA+单片机架构,并使用FPGA进行时钟同步。这种方式传输稳定,但是缺点也明显。(1)成本高,这是由于系统使用了双芯片,FPGA+单片机;(2)传输协议不灵活,由于网络音频部分是采用FPGA进行处理,而FPGA做逻辑性较差,所以导致系统不具有完整的TCP/IP协议栈;(3)开发时间长,需要单独开发FPGA及单片机,并且两块芯片之间还需要制定相关协议和长时间调试;(4)开发人员多,需要有FPGA和单片机的专业工程师才能完成整个软件的设计;并且出问题时,不能一个人单独去处理并修改软件BUG。
技术实现思路
本专利技术针对
技术介绍
的问题提供一种网络音频混音处理方法及装置,提高运算效率,容易在单片机中实现,只采用一个单片机节约成本。为了实现上述目的,本专利技术提出一种网络音频混音处理方法,包括以下步骤:将各路音频数据进行有符号累加;对累加后音频数据进行分段压缩;确定各分段的衰减因子;获取输出的混音音频信号。优选地,所述的有符号累加,具体为:包含数据位数中的符号位进行累加。优选地,所述的对累加后音频数据进行分段压缩,分段区间的长度为2Q-1,其中,Q表示音频数据位数。优选地,所述的确定各分段的衰减因子,具体为:其中,表示第n分段区间内的衰减因子,ni=min(|MixData|/2Q-1,4),MixData表示累加后的音频数据,Q表示音频数据位数;k表示基本衰减因子,k>1。优选地,所述的将各路音频数据进行有符号累加步骤与对累加后音频数据进行分段压缩步骤之间,还包括:对累加后的音频数据取绝对值。优选地,所述的获取输出的混音音频信号,包括:对数据进行恢复符号操作。优选地,所述的对数据进行恢复符号操作步骤之前,还包括:分离获取累加后音频数据的高位数据和低位数据。优选地,所述的对数据进行恢复符号操作,具体公式如下:其中,Output表示恢复符号操作后的输出的混音音频信号;MixData表示累加后的音频数据;表示第n分段区间内的衰减因子,sgn(.)表示符号函数,nj=min(|MixData|/2Q-1,4),Q表示音频数据位数;dj(t)=cj(t)*7;cj(t)=MOD(|MixData|,2Q-1)。本专利技术还提出一种网络音频混音处理装置,包括:单片机;存储器,耦合至所述的单片机并存储有指令,所述的指令在由所述单片机执行实现所述的网络音频混音处理方法的步骤。本专利技术提出一种网络音频混音处理方法及装置,所述混音处理方法采用分段压缩的方法进行混音,即使得运算效率高,也容易在单片机中实现;通过实际波形观察,得出该方法混音后,并没有溢出及切顶现象,而是都压缩在接近上下限的位置,音量较大,剩余可懂度高,听起来也没有明显噪声干扰;本专利技术装置只需要使用ARMCortexTM-M4架构以上的单片机即可实现功能;并且利用现有的LWIP协议栈,使系统能够支持TCP/IP中基本的传输协议;由于只需要一个单片机处理的缘故,从电路上就可以省去一块FPGA,从而节约成本;另外,在对接外部设备时也能够通过标准的TCP/IP协议进行通信;开发方便,去除了FPGA调试固有的复杂性,系统软件升级也比较方便,因为只有一个主控芯片,所以可以使用网络升级。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术第一优选实施例中网络音频混音处理方法流程图;图2为本专利技术第二优选实施例中网络音频混音处理方法流程图;图3为本专利技术第三优选实施例中网络音频混音处理方法流程图;图4为本专利技术一种实施例中音频混合波形图;其中,图(a)为第一路音频波形图,图(b)为第二路音频波形图,图(c)为第三路音频波形图,图(d)为第四路音频波形图,图(e)为第五路音频波形图,图(f)为混合音频波形图;图5为本专利技术第四优选实施例中网络音频混音处理装置结构示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明,若本专利技术实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。另外,若本专利技术实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。本专利技术提出一种网络音频混音处理方法;本专利技术第一优选实施例中,如图1所示,包括以下步骤:S10、将各路音频数据进行有符号累加;本专利技术实施例中,所述的有符号累加,具体为:包含数据位数中的符号位进行累加;本专利技术与输入信号Input输入信号无关,而与混音后的MixData有关;S20、对累加后音频数据进行分段压缩;本专利技术实施例中,对累加后音频数据MixData进行分段压缩,以消除MixData可能产生的溢出;无论参与混音的信号路数M为多少,|MixData|幅度绝对值的值域为[0,+∞);现在对[0,+∞)进行分段,每个区间的长度为2Q-1;从0开始计数,第0个区间的范围是[0,2Q-1],第1个区间的范围是[2Q-1,2*2Q-1];依次类推,第n个区间范围是n*2Q-1,(n+1)*2Q-1];S30、确定各分段的衰减因子;本专利技术实施例中,确定各分段的衰减因子,具体为:其中,表示第n分段区间内的衰减因子,nj=min(|MixData|/2Q-1,4),MixData表示累加后的音频数据,Q表示音频数据位数;k表示基本衰减因子,k一般取2的整数次幂;根据算法特点,k值太小会较大地收缩波形造成整体失真,太大则会导致高强度信号严重失真。所以取k=8或16较好。本实施例中取8;S40、获本文档来自技高网...

【技术保护点】
1.一种网络音频混音处理方法,其特征在于,包括以下步骤:将各路音频数据进行有符号累加;对累加后音频数据进行分段压缩;确定各分段的衰减因子;获取输出的混音音频信号。

【技术特征摘要】
1.一种网络音频混音处理方法,其特征在于,包括以下步骤:将各路音频数据进行有符号累加;对累加后音频数据进行分段压缩;确定各分段的衰减因子;获取输出的混音音频信号。2.根据权利要求1所述的网络音频混音处理方法,其特征在于,所述的有符号累加,具体为:包含数据位数中的符号位进行累加。3.根据权利要求1所述的网络音频混音处理方法,其特征在于,所述的对累加后音频数据进行分段压缩,分段区间的长度为2Q-1,其中,Q表示音频数据位数。4.根据权利要求1所述的网络音频混音处理方法,其特征在于,所述的确定各分段的衰减因子,具体为:其中,表示第n分段区间内的衰减因子,ni=min(|MixData|/2Q-1,4),MixData表示累加后的音频数据,Q表示音频数据位数;k表示基本衰减因子,k>1。5.根据权利要求1所述的网络音频混音处理方法,其特征在于,所述的将各路音频数据进行有符号累加步骤与对累加后音频数据进行分段压缩步骤之间,还包括:对累加后的音频数据取绝对...

【专利技术属性】
技术研发人员:赵定金朱正辉张常华明德
申请(专利权)人:广州市保伦电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1