一种实现视频通话的方法、装置和系统制造方法及图纸

技术编号：16302827 阅读：63 留言：0更新日期：2017-09-26 21:04

一种实现视频通话的方法、装置和系统，包括：第一终端分别采集数字音频信号和数字视频信号；第一终端将数字音频信号转换为文本信息，将文本信息封装成文本包，将数字音频信号封装成音频包，将数字视频信号封装成视频包；第一终端分别将文本包、音频包和视频包发送给第二终端。

Method, device and system for realizing video call

Including the realization method, device and system for video calls, respectively: the first terminal acquisition digital audio signal and the digital video signal; a first terminal of digital audio signals are converted to text information, text information is encapsulated into text, the digital audio signal into audio packet encapsulation, digital video signal will be packaged into a video package; the first terminals are text packets, an audio packet and a video packet is sent to the terminal second.

全部详细技术资料下载

【技术实现步骤摘要】
一种实现视频通话的方法、装置和系统
本文涉及但不限于视频通话领域，尤指一种实现视频通话的方法、装置和系统。
技术介绍
随着移动和互联网宽带技术的飞速发展，使可视通讯增值业务在家庭用户中得到迅速的推广，通过基于这个业务的技术可以得到面对面的交流以及网上视频教学等增值业务的服务，如果为可视通讯业务的音频增加同步字幕，不但能够给听力差的用户提供更好的服务，而且可以在网络不佳的情况下对实际的音频效果作一个有益的补充。相关技术中，实现视频通话中增加语音字幕的方法大致包括：第一终端分别采集数字音频信号和数字视频信号；对采集的数字音频信号进行语音编码处理，将语音编码处理后的数字音频信号封装成音频包；并将采集的数字音频信号通过语音识别技术转换为文本信息，将文本信息与采集的数字视频信号叠加合成后进行视频编码处理，将视频编码处理后的数字视频信号封装成视频包；分别将音频包和视频包发送给第二终端；第二终端接收到音频包和视频包，对音频包中语音编码处理后的数字音频信号进行语音解码得到数字音频信号并播放，对视频包中频编码处理后的数字视频信号进行视频解码得到数字视频信号并显示。上述方法中，当网络...
一种实现视频通话的方法、装置和系统

【技术保护点】
一种实现视频通话的方法，其特征在于，包括：第一终端分别采集数字音频信号和数字视频信号；第一终端将数字音频信号转换为文本信息，将文本信息封装成文本包，将数字音频信号封装成音频包，将数字视频信号封装成视频包；第一终端分别将文本包、音频包和视频包发送给第二终端。

【技术特征摘要】
1.一种实现视频通话的方法，其特征在于，包括：第一终端分别采集数字音频信号和数字视频信号；第一终端将数字音频信号转换为文本信息，将文本信息封装成文本包，将数字音频信号封装成音频包，将数字视频信号封装成视频包；第一终端分别将文本包、音频包和视频包发送给第二终端。2.根据权利要求1所述的方法，其特征在于，所述将数字音频信号封装成音频包之前还包括：所述第一终端对所述数字音频信号进行语音编码处理；所述将数字音频信号封装成音频包包括：所述第一终端对语音编码处理后的数字音频信号封装成所述音频包。3.根据权利要求1所述的方法，其特征在于，所述将数字视频信号封装成视频包之前还包括：所述第一终端对所述数字视频信号进行视频编码处理；所述将数字视频信号封装成视频包包括：所述第一终端对视频编码处理后的数字视频信号封装成所述视频包。4.一种实现视频通话的方法，其特征在于，包括：第二终端接收到来自第一终端的文本包；第二终端判断出接收到的文本包中的时间戳对应的时间小于或等于正在播放的音频包或正在显示的视频包的时间戳对应的时间，显示接收到的文本包和缓存的文本包中，时间戳字段对应的时间小于或等于正在播放的音频包或正在显示的视频包的时间戳字段对应的时间的文本包中的文本信息。5.根据权利要求4所述的方法，其特征在于，当所述第二终端判断出所述接收到的文本包中的时间戳对应的时间大于正在播放的音频包或正在显示的视频包的时间戳对应的时间时，该方法还包括：所述第二终端缓存所述接收到的文本包。6.根据权利要求5所述的方法，其特征在于，当第二终端在接收到所述文本包后的预设时间内未接收到音频包和视频包时，该方法还包括：所述第二终端显示缓存的文本包中的文本信息。7.根据权利要求4所述的方法，其特征在于，所述第二终端接收到来自第一终端的文本包后，在所述第二终端判断出接收到的文本包中的时间戳对应的时间小于或等于正在播放的音频包或正在显示的视频包的时间戳对应的时间之前还包括：所述第二终端判断出字幕显示功能已打开。8.一种第一终端，其特征在于，包括：采集模块，用于分别采集数字音频信号和数字视频信号；第一处理模块，用于将数字音频信号转换为文本信息，将文本信息封装成文本包，将数字音频信号封装成音频包，将数字视频信号封装成视频包；发送模块，用于分别将文本包、音频...

【专利技术属性】
技术研发人员：程岑，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人