支持电视会议同声传译的方法及云端服务器技术

技术编号:11161297 阅读:55 留言:0更新日期:2015-03-18 17:11
本发明专利技术涉及一种支持电视会议同声传译的方法及云端服务器,该方法包括:云端服务器在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM音频数据;云端服务器对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型;云端服务器根据确定的语言类型将所述PCM音频数据转换成对应的文本信息;云端服务器将转换的各个文本信息翻译成预设语言类型对应的文本信息,并将翻译的预设语言类型对应的文本信息转换成对应的音频流数据。从而实现了在电视会议时可方便、快速的进行同声传译。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种支持电视会议同声传译的方法及云端服务器,该方法包括:云端服务器在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM音频数据;云端服务器对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型;云端服务器根据确定的语言类型将所述PCM音频数据转换成对应的文本信息;云端服务器将转换的各个文本信息翻译成预设语言类型对应的文本信息,并将翻译的预设语言类型对应的文本信息转换成对应的音频流数据。从而实现了在电视会议时可方便、快速的进行同声传译。【专利说明】支持电视会议同声传译的方法及云端服务器
本专利技术涉及通信
,尤其涉及一种支持电视会议同声传译的方法及云端服务器。
技术介绍
电视会议是一种是利用电视技术和电话,通过通信网络召开会议的一种多媒体通信方式,在召开电视会议时,使处于两地或多个不同地点的人员,进行语音、图像等数据之间的交互。 在传统的电视会议中,由于开会人员语言上的差异需使用多种语言时,就需对会场上的发言进行同声传译。现有技术中为了实现同声传译一般都设置了专门的翻译会场,通过专业的翻译人员在电视会议进行的同时对发言人的发言进行人工实时翻译。虽然这种方式解决了在电视会议中的同声传译问题,但其成本比较大,实现起来较不方便。
技术实现思路
本专利技术的主要目的在于提供一种支持电视会议同声传译的方法及云端服务器。旨在进行电视会议时可方便、快速的实现同声传译。 本专利技术提供一种支持电视会议同声传译的方法,包括:云端服务器在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM音频数据;云端服务器对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型;云端服务器根据确定的语言类型将所述PCM音频数据转换成对应的文本信息;云端服务器将转换的各个文本信息翻译成预设语言类型对应的文本信息,并将翻译的预设语言类型对应的文本信息转换成对应的音频流数据。 优选地,在所述云端服务器将解码后的音频数据转换成对应的PCM音频数据的步骤之前,该方法还包括:云端服务器将解码后的音频数据进行自动噪音抑制处理及/或自动增益控制处理,以对解码后的音频数据进行背景噪音的消除及/或音量的自动控制。 优选地,所述云端服务器对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型的步骤包括:云端服务器分析所述PCM音频数据是否为同一音色的PCM音频数据;若所述PCM音频数据为同一音色的PCM音频数据,则确定所述PCM音频数据对应的语言类型;若所述PCM音频数据包含不同音色的PCM音频数据,则按照音色的不同对所述PCM音频数据进行分类,并确定分类的各类PCM音频数据对应的语言类型。 优选地,在所述云端服务器将翻译的预设语言类型对应的文本信息转换成对应的音频流数据的步骤之后,该方法还包括:云端服务器在接收到播放装置发送的包含语言类型的数据请求时,响应该数据请求,以将该数据请求中的语言类型对应的文本信息及音频流发送给所述播放装置。 优选地,在所述云端服务器将转换的各个文本信息翻译成预设语言类型对应的文本信息的步骤之前,该方法还包括:云端服务器对转换的文本信息进行自动纠错。 优选地,在所述云端服务器将翻译的预设语言类型对应的文本信息转换成对应的音频流数据的步骤之后,该方法还包括:云端服务器确定各个预设语言类型对应的播放装置,并将各个预设语言类型对应的文本信息和音频流数据发送给对应的播放装置。 本专利技术还提供一种支持电视会议同声传译的云端服务器,该云端服务器包括:解码模块,用于在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM音频数据;确定模块,用于对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型;转换模块,用于根据确定的语言类型将所述PCM音频数据转换成对应的文本信息;翻译模块,用于将转换的各个文本信息翻译成预设语言类型对应的文本信息,并将翻译的预设语言类型对应的文本信息转换成对应的音频流数据。 优选地,所述解码模块,还用于将解码后的音频数据进行自动噪音抑制处理及/或自动增益控制处理,以对解码后的音频数据进行背景噪音的消除及/或音量的自动控制。 优选地,还包括:收发模块,用于在接收到播放装置发送的包含语言类型的数据请求时,响应该数据请求,以将该数据请求中的语言类型对应的文本信息及音频流发送给所述播放装置。 优选地,所述收发模块,还包括:多点控制单元,用于确定各个预设语言类型对应的播放装置,并将各个预设语言类型对应的文本信息和音频流数据发送给对应的播放装置。 本专利技术通过对接收到的音频数据翻译成具有多国语言的文本信息,通过语音播报的方式将具有多国语言的文本信息分别处理成对应的音频流。从而实现了在电视会议时可方便、快速的进行同声传译。 【专利附图】【附图说明】 图1是本专利技术支持电视会议同声传译的方法第一实施例的流程示意图; 图2是上述第一实施例中包括步骤S105的流程示意图; 图3是本专利技术支持电视会议同声传译的方法第二实施例的流程示意图; 图4是本专利技术支持电视会议同声传译的方法第三实施例的流程示意图; 图5是本专利技术支持电视会议同声传译的云端服务器的结构示意图; 图6是图5中收发模块的结构示意图。 本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。 【具体实施方式】 下面结合附图及具体实施例就本专利技术的技术方案做进一步的说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。 在以下实施例中如图1、图2所示,所提供的支持电视会议同声传译的方法,包括: 步骤S101,云端服务器在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM(Pulse-code modulat1n,脉冲编码调制)音频数据。所述音频数据是所述采集装置从所处的所述电视会议的现场采集而得的会议参与人的原始语音。 进一步地,为了获得更好音质的PCM音频数据,云端服务器在将解码后音频数据转换成PCM音频数据之前,将解码后的音频数据进行ANS (Automatic Noise Suppress1n,自动噪音抑制WPAGC (Automatic Gain Control,自动增益控制)处理,以对解码后的音频数据进行背景噪音的消除和音量的自动控制。本实施例中,云端服务器支持多种编码格式的音频数据的解码。 需要说明的是,云端服务器将解码后的音频数据转换成PCM音频数据的转换方式为PCM方式。 步骤S102,云端服务器对PCM音频数据进行语音识别,以确定所述PCM音频数据对应的语言类型。 具体地,云端服务器分析所述PCM音频数据是否为同一音色的PCM音频数据;若所述PCM音频数据为同一音色的PCM音频数据,则确定所述PCM音频数据对应的语言类型(例如,中文、英语、德语、法语或者阿拉伯语等);本文档来自技高网...

【技术保护点】
一种支持电视会议同声传译的方法,其特征在于,包括:云端服务器在接收到采集装置发送的电视会议的音频数据后,对接收自所述采集装置的音频数据进行解码,并将解码后的音频数据转换成对应的PCM音频数据;云端服务器对转换的PCM音频数据进行语音识别,以确定转换的PCM音频数据对应的语言类型;云端服务器根据确定的语言类型将所述PCM音频数据转换成对应的文本信息;云端服务器将转换的各个文本信息翻译成预设语言类型对应的文本信息,并将翻译的预设语言类型对应的文本信息转换成对应的音频流数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴瑛丁鹏石挺干
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1