一种多路音频数据处理方法和系统技术方案

技术编号：36455611 阅读：15 留言：0更新日期：2023-01-25 22:53

本发明专利技术提供了一种多路音频数据处理方法，包括：处于同一会议场景中的任一媒体服务器获取第一音频流；媒体服务器将第一音频流拼接得到的拼接音频流发送给处于同一会议场景k中的其它媒体服务器；媒体服务器获取第二音频流；媒体服务器将第二拼接音频流发送给会议场景中的任一终端设备；该终端设备基于自身的会议状态标识和第二拼接音频流中的每个数据对应的终端设备的会议状态标识，选择需要混音的数据进行混音并播放。本发明专利技术还提供了一种多路音频数据处理系统。本发明专利技术能够减少媒体服务器的负载，能够减少音频和提高音频通信效果。能够减少音频和提高音频通信效果。能够减少音频和提高音频通信效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种多路音频数据处理方法和系统

[0001]本专利技术涉及网络
，特别是涉及一种多路音频数据处理方法和系统。

技术介绍

[0002]随着移动通信技术和互联网技术的发展，基于多媒体服务器多终端开展的音频通信的应用越来越广泛。
[0003]在音频通信过程中，参与会议的媒体服务器会将所属的终端的音频流进行混音，生成混音数据并发送给会议中的其它媒体服务器，同时会接收其它媒体服务器发送的混音数据，并将接收到的混音数据与自身的混音数据进行混音处理后发送给每个所属的终端，以使得每个终端的用户能够听见会议中其它终端的用户的声音。然而，在媒体服务器存在多个终端并且终端不是处于同一会议场景中而是处于不同会议场景中时即多路音频组会场景时，每个媒体服务器就需要进行多次的混音处理操作，这会导致媒体服务器的负载过大，进而会增加音频延迟，降低音频通信效果。

技术实现思路

[0004]针对上述技术问题，本专利技术采用的技术方案为：
[0005]本专利技术一实施例提供一种多路音频数据处理方法，用于对多媒体服务器级联模式下的多路音频组会议场景中的任一会议场景k中的音频数据进行处理，k的取值为1到C，C为会议场景的数量，所述方法包括以下步骤：
[0006]S100，处于同一会议场景k中的任一媒体服务器i获取第一音频流D1
ik
＝(D1
ki1
，D1
ki2
，
…
，D1
kih
，
…
，D1
kit...

【技术保护点】

【技术特征摘要】
1.一种多路音频数据处理方法，其特征在于，用于对多媒体服务器级联模式下的多路音频组会议场景中的任一会议场景k中的音频数据进行处理，k的取值为1到C，C为会议场景的数量，所述方法包括以下步骤：S100，处于同一会议场景k中的任一媒体服务器i获取第一音频流D1
ik
＝(D1
ki1
，D1
ki2
，
…
，D1
kih
，
…
，D1
kit(i)
)，D1
kih
为与媒体服务器i连接的终端设备中参与会议场景k的第h个终端设备T
kih
的音频数据，h的取值为1到t(i)，t(i)为与媒体服务器i连接的终端设备中参与会议场景k的终端设备的数量，i的取值为1到n，n为会议场景k中的媒体服务器的数量；其中，D1
kih
中包括对应的终端设备的会议状态标识，所述会议状态标识基于终端设备的用户权限和终端设备的声音输入设备和声音输出设备的状态确定；S120，媒体服务器i将第一拼接音频流SD1
ki
＝D1
ki1
+D1
ki2
+
…
+D1
kih
+
…
+D1
kit(i)
发送给处于同一会议场景k中的其它媒体服务器；+表示拼接；S140，媒体服务器i获取第二音频流D2
ik
＝(D2
ki1
，D2
ki2
，
…
，D2
pih
，
…
，D2
kim
)，D2
pih
为处于会议场景k中与媒体服务器i连接的第p个媒体服务器拼接的音频数据，p的取值为1到m，m为处于会议场景k中的媒体服务器数量；其中，D2
pih
中包括对应的终端设备的会议状态标识；S160，媒体服务器i将混合音频流SD2
kih
发送给T
kih
；SD2
kih
包括SD1
ki
和D2
ik
；S180，基于T
kih
的会议状态标识和SD2
kih
中的每个数据对应的终端设备的会议状态标识，从接收到的SD2
kih
中选择需要混音的数据进行混音并播放。2.根据权利要求1所述的方法，其特征在于，所述会议状态标识包括第一状态标识、第二状态标识、第三状态标识和第四状态标识；如果某个终端设备的状态标识为第一状态标识，则表示该终端设备的声音输出设备处于静音状态，但声音输入设备处于非静音状态；如果某个终端设备的状态标识为第二状态标识，则表示该终端设备的声音输出设备处于非静音状态，但声音输入设备处于静音状态；如果某个终端设备的状态标识为第三状态标识，则表示该终端设备的声音输出设备处于静音状态，并且声音输入设备处于静音状态；如果某个终端设备的状态标识为第四状态标识，则表示该终端设备的声音输出设备处于静音状态，但声音输入设备只对于用户权限为设定权限的终端设备处于非静音状态；如果某个终端设备的状态标识为第五状态标识，则表示该终端设备的声音输出设备只对于用户权限为设定权限的终端设备处于非静音状态，但声音输入设备处于静音状态。3.根据权利要求2所述的方法，其特征在于，S180进一步包括：S181，如果T
kih
的会议状态标识为第二状态标识或者第五状态标识，执行S182；否则，执行S184；S182，如果T
kih
的会议状态标识为第二状态标识，从SD2
kih
中获取为第一状态标识和第四状态标识的数据进行混音并进行播放；S183，如果T
kih
的会议状态标识为第五状态标识，从SD2
kih
中获取为第一状态标识的数据进行混音并进行播放；S184，将SD2
kih
中的数据设置为0。4.根据权利要求1所述的方法，其特征在于，在S160中，SD2
kih
为加入协议信息后的数据。
5.根据权利要求1所述的方法，其特征在于，在S180中，SD2
kih
为经过解压处理后的数...

【专利技术属性】
技术研发人员：王安良，温嘉奇，谢辰同，肖昊，刘海亮，丁弘华，
申请(专利权)人：北京华建云鼎科技股份公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人