一种基于WASM的实时语音通信方法、终端及摄像头技术

技术编号：41128944 阅读：5 留言：0更新日期：2024-04-30 17:57

本发明专利技术属于语音通信技术领域，公开了一种基于WASM的实时语音通信方法、终端及摄像头，所述方法包括：采集原始音频数据；基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流；生成预设格式的音频流的接收控制请求；将预设格式的音频流发送到流媒体服务器以及将接收控制请求发送至控制平台，所述控制平台用于根据接收控制请求生成音频流拉取指令，基于SIP信令将音频流拉取指令发送至摄像头。本发明专利技术的通信方法能够更快速地完成对音频数据的处理，具有更低的音频传输延迟；以及可以在任意的浏览器上运行，具有良好的可移植性和兼容性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音通信，具体涉及一种基于wasm的实时语音通信方法、终端及摄像头。

技术介绍

1、实时语音技术是一种能够将人类的语音立即转换为文字或者用于其他处理的技术。它可以广泛应用于多个领域，如语音识别、语音翻译、语音合成等。实时语音技术的发展对促进信息获取、提高沟通效率、以及实现智能交互等方面具有重要意义。

2、ipc网络摄像头，即网络视频监控摄像头，是一种通过网络进行视频传输的监控设备，这些摄像头使用互联网协议来进行视频数据的捕捉、编码、传输以及存储。现有的ipc网络摄像头支持实时双向语音通话，ipc网络摄像头能够接收客户端的语音消息，可应用在家庭监控、远程办公、视频会议、安防监控等领域。

3、目前，ipc网络摄像头与客户端之间的实时语音的常用实现方法如下：

4、其一：基于服务器和客户端模型的实现方法：在这种方法中，语音数据从一端采集，然后通过网络传输到另一端进行播放，这种方法需要服务器和客户端之间的实时通信，可以使用tcp或udp协议；

5、其二：基于webrtc的实现方法：webrtc（web实时通信）是一种实时通信技术，可以实现点对点的音视频通话，webrtc提供了数据传输和信令机制，可以实现实时语音通信。

6、但现有的实现方法在实际应用中还至少存在以下问题：

7、1、部分客户端不支持webrtc技术；

8、2、实时语音通话需要保证传输速度快、延迟低。但传统的客户端到服务器的实时语音传输由于网络延迟、音频编解码延迟等因素的影响，往往

技术实现思路

1、本专利技术的目的是提供一种基于wasm的实时语音通信方法、终端及摄像头，用以解决现有技术中存在的语音传输延迟较高的问题。

2、为了实现上述目的，本专利技术采用以下技术方案：

3、第一方面，本专利技术提供了一种基于wasm的实时语音通信方法，应用于客户终端，所述方法包括：

4、采集原始音频数据；

5、基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流；

6、生成预设格式的音频流的接收控制请求；

7、将预设格式的音频流发送到流媒体服务器以及将接收控制请求发送至控制平台，所述控制平台用于根据接收控制请求生成音频流拉取指令，基于sip信令将音频流拉取指令发送至摄像头，所述摄像头用于基于音频流拉取指令拉取流媒体服务器中的客户终端上传的预设格式的音频流。

8、优选地，将预设格式的音频流发送到流媒体服务器的数据传输协议为rtmp协议。

9、优选地，采集原始音频数据，包括：

10、在发起音频采集请求时，加载wasm模块；

11、在wasm模块加载完成后，基于wasm模块获取原始音频数据。

12、优选地，基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流，包括：

13、基于wasm模块调用预设函数实例；

14、以预设函数实例对原始音频数据进行编码，得到音频数组；

15、对音频数组进行编译，得到预设格式的音频流。

16、优选地，所述预设格式为g711a格式。

17、优选地，所述控制平台还用于：基于sip信令将音频流拉取指令同时发送给至少两台摄像头。

18、第二方面，本专利技术提供了一种基于wasm的实时语音通信方法，应用于摄像头，所述方法包括：

19、响应于控制平台的音频流拉取指令，拉取流媒体服务器中的客户终端上传的预设格式的音频流，其中，所述控制平台的音频流拉取指令根据客户终端的接收控制请求生成，所述预设格式的音频流为客户终端对采集到的原始音频数据进行编码后得到的预设格式的音频流；

20、对预设格式的音频流的进行解码，得到解码后的音频数据；

21、对解码后的音频数据进行播放。

22、优选地，从流媒体服务器中拉取预设格式的音频流的数据传输协议为rtmp协议。

23、第三方面，本专利技术提供了一种客户终端，用于实现上述的基于wasm的实时语音通信方法，所述终端包括：

24、数据采集模块，用于采集原始音频数据；

25、编码模块，用于基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流；

26、请求生成模块，用于生成预设格式的音频流的接收控制请求；

27、发送模块，用于将预设格式的音频流发送到流媒体服务器以及将接收控制请求发送至控制平台，所述控制平台用于根据接收控制请求生成音频流拉取指令，基于sip信令将音频流拉取指令发送至摄像头。

28、第四方面，本专利技术提供了一种摄像头，用于实现上述的基于wasm的实时语音通信方法，所述摄像头包括：

29、拉取模块，用于响应于控制平台的音频流拉取指令，拉取流媒体服务器中的客户终端上传的预设格式的音频流，其中，所述控制平台的音频流拉取指令根据客户终端的接收控制请求生成，所述预设格式的音频流为客户终端对采集到的原始音频数据进行编码后得到的预设格式的音频流；

30、解码模块，用于对预设格式的音频流的进行解码，得到解码后的音频数据；

31、播放模块，用于对解码后的音频数据进行播放。

32、有益效果：

33、1、本专利技术的通信方法能够更快速地完成对音频数据的处理，具有更低的音频传输延迟；

34、2、本专利技术的通信方法可以在任意的浏览器上运行，具有良好的可移植性和兼容性。

本文档来自技高网...

【技术保护点】

1.一种基于WASM的实时语音通信方法，应用于客户终端，其特征在于，所述方法包括：

2.根据权利要求1所述的基于WASM的实时语音通信方法，其特征在于，将预设格式的音频流发送到流媒体服务器的数据传输协议为RTMP协议。

3.根据权利要求1所述的基于WASM的实时语音通信方法，其特征在于，采集原始音频数据，包括：

4.根据权利要求3所述的基于WASM的实时语音通信方法，其特征在于，基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流，包括：

5.根据权利要求4所述的基于WASM的实时语音通信方法，其特征在于，所述预设格式为G711A格式。

6.根据权利要求1所述的基于WASM的实时语音通信方法，其特征在于，所述控制平台还用于：基于SIP信令将音频流拉取指令同时发送给至少两台摄像头。

7.一种基于WASM的实时语音通信方法，应用于摄像头，其特征在于，所述方法包括：

8.根据权利要求7所述的基于WASM的实时语音通信方法，其特征在于，从流媒体服务器中拉取预设格式的音频流的数据传输协议为RTMP协议。

9.一种客户终端，用于实现权利要求1-6中任一项所述的基于WASM的实时语音通信方法，其特征在于，所述终端包括：

10.一种摄像头，用于实现权利要求7或8所述的基于WASM的实时语音通信方法，其特征在于，所述摄像头包括：

...

【技术特征摘要】

1.一种基于wasm的实时语音通信方法，应用于客户终端，其特征在于，所述方法包括：

2.根据权利要求1所述的基于wasm的实时语音通信方法，其特征在于，将预设格式的音频流发送到流媒体服务器的数据传输协议为rtmp协议。

3.根据权利要求1所述的基于wasm的实时语音通信方法，其特征在于，采集原始音频数据，包括：

4.根据权利要求3所述的基于wasm的实时语音通信方法，其特征在于，基于预设函数实例对原始音频数据进行编码，得到预设格式的音频流，包括：

5.根据权利要求4所述的基于wasm的实时语音通信方法，其特征在于，所述预设格式为g711a格式。

6.根据权...

【专利技术属性】
技术研发人员：姜宏，罗佳丽，李文昇，
申请(专利权)人：四川广飞视信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人