一种通话即时翻译系统和方法技术方案

技术编号:8272086 阅读:169 留言:0更新日期:2013-01-31 04:32
本发明专利技术公开了一种通话即时翻译系统和方法。该系统包括切分器、语音识别装置、翻译装置和语音合成装置,其中,所述切分器用于连接到交换机并将输入语音信号切分为一个或多个音频文件;所述语音识别装置与所述切分器相连,用于将所述一个或多个音频文件转录为源语言的文本;所述翻译装置与所述语音识别装置相连,用于将所述源语言的文本翻译为目标语言的文本;以及所述语音合成装置与所述翻译装置相连,用于将所述目标语言的文本转换为输出语音信号,并输出给所述交换机。上述通话即时翻译系统和方法能够使得语言不通的通话双方可以实现实时的自由交流。

【技术实现步骤摘要】
本专利技术涉及即时翻译领域,尤其涉及一种通话即时翻译系统和方法
技术介绍
在当今的时代,不同国家的人由于政治、经济、文化、娱乐等多方面需求要经常进行沟通,通过网络和电话等方式可以便利地实现不同地域的人之间的交流。然而除了需要网络、电话等便利的信息传输媒介外,还要解决语言不通的问题。熟练掌握一门外语并与其它国家的人顺畅交流是不容易的。因此,语言不通是不同国家的人交流的最大障碍。目前,网络上或是手机等智能终端上存在不少翻译软件,但这些翻译软件通常不能用于即时通话。因此,需要提供一种通话即时翻译系统和方法以解决上述问题。
技术实现思路

技术实现思路
部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明。本专利技术的
技术实现思路
部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。为了解决上述问题,本专利技术公开了一种用于通话即时翻译系统,包括切分器、语音识别装置、翻译装置和语音合成装置,其中,所述切分器用于连接到交换机并将输入语音信号切分为一个或多个音频文件;所述语音识别装置与所述切分器相连,用于将所述一个或多个音频文件转录为源语言的文本;所述翻译装置与所述语音识别装置相连,用于将所述源语言的文本翻译为目标语言的文本;以及所述语音合成装置与所述翻译装置相连,用于将所述目标语言的文本转换为输出语音信号,并输出给所述交换机。在本专利技术一个优选实施例中,所述系统还包括存储器,其连接在所述切分器和所述语音识别装置之间;其中,所述切分器还用于将所述一个或多个音频文件存储至所述存储器;并且所述语音识别装置所转录的所述一个或多个音频文件来自于所述存储器。 在本专利技术一个优选实施例中,所述系统还包括语言确定装置,其与所述切分器相连,用于确定通话双方使用的语言;其中,所述通话双方使用的语言中的一种作为所述源语言,另一种作为所述目标语言。在本专利技术一个优选实施例中,所述系统还包括输入接口,用于从所述交换机接收所述输入语音信号;以及输出接口,用于输出所述输出语音信号至所述交换机。在本专利技术一个优选实施例中,所述切分器进一步包括检测单元,用于检测所述输入语音信号中的静音部分;以及分割单元,用于基于所检测的静音部分将所述输入语音信号切分为所述一个或多个音频文件。优选地,所述静音部分包括在O. 6秒或O. 6秒以上的时间段内分贝值小于或等于噪声阈值的部分。在本专利技术一个优选实施例中,所述系统还包括自动增益控制器,其与所述切分器相连,用于并对所述输入语音信号进行增益控制。在本专利技术一个优选实施例中,所述自动增益控制器进一步包括放大单元,用于将分贝值小于设定值的所述输入语音信号放大至所述设定值;以及缩小单元,用于将分贝值大于所述设定值的所述输入语音信号缩小至所述设定值。在本专利技术一个优选实施例中,所述系统还包括滤波器,其与所述切分器相连,用于对所述输入语音信号进行降噪处理。优选地,所述滤波器为维纳滤波器。根据本专利技术另一方面,还提供了一种通话即时翻译方法,包括将输入语音信号切分为一个或多个音频文件;将所述一个或多个音频文件转录为源语言的文本;将所述源语言的文本翻译为目标语言的文本;以及将所述目标语言的文本转换为输出语音信号。在本专利技术一个优选实施例中,所述切分后还包括将所述一个或多个音频文件存 储至存储器;并且所转录的所述一个或多个音频文件来自于所述存储器。在本专利技术一个优选实施例中,所述切分前还包括确定通话双方使用的语言;其中,所述通话双方使用的语言中的一种作为所述源语言,另一种作为所述目标语言。在本专利技术一个优选实施例中,所述切分前还包括从交换机接收所述输入语音信号;以及所述转换后还包括将所述输出语音信号输出至所述交换机。在本专利技术一个优选实施例中,所述切分进一步包括检测所述输入语音信号中的静音部分;以及基于所检测的静音部分将所述输入语音信号切分为所述一个或多个音频文件。优选地,所述静音部分包括在O. 6秒或O. 6秒以上的时间段内分贝值小于或等于噪声阈值的部分。在本专利技术一个优选实施例中,所述切分前还包括对所述输入语音信号进行增益控制。在本专利技术一个优选实施例中,所述增益控制进一步包括将分贝值小于设定值的所述输入语音信号放大至所述设定值;以及将分贝值大于所述设定值的所述输入语音信号缩小至所述设定值。在本专利技术一个优选实施例中,所述切分前还包括对所述输入语音信号进行降噪处理。优选地,所述降噪处理进一步包括对所述输入语音信号进行维纳滤波。本专利技术所提供的上述通话即时翻译系统和方法能够使得语言不通的通话双方可以实现实时的自由交流。附图说明本专利技术的下列附图在此作为本专利技术的一部分用于理解本专利技术。附图中示出了本专利技术的实施例及其描述,用来解释本专利技术的原理。在附图中,图I示出了根据本专利技术一个优选实施例的通话即时翻译系统的结构框图;图2示出了根据本专利技术一个优选实施例的输入语音信号的示意图;图3示出了根据本专利技术一个优选实施例的通话即时翻译方法的流程图;图4示出了包括根据本专利技术一个优选实施例的通话即时翻译系统的通话系统的示意图。具体实施例方式在下文的描述中,给出了大量具体的细节以便提供对本专利技术更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本专利技术可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本专利技术发生混淆,对于本领域公知的一些技术特征未进行描述。为了彻底了解本专利技术,将在下列的描述中提出详细的结构。显然,本专利技术的施行并不限定于本领域的技术人员所熟习的特殊细节。本专利技术的较佳实施例详细描述如下,然而除了这些详细描述外,本专利技术还可以具有其他实施方式。根据本专利技术的一方面,提供了一种通话即时翻译系统。图I示出了根据本专利技术一个优选实施例的通话即时翻译系统100的结构框图。如图I所示,该通话即时翻译系统包括 切分器104、语音识别装置106、翻译装置107和语音合成装置108。其中,切分器104用于连接到外部交换机并将输入语音信号切分为一个或多个音频文件。语音识别装置106与切分器104相连,用于将切分器104所切分的一个或多个音频文件转录为源语言的文本。翻译装置107与语音识别装置106相连,用于将语音识别装置106所转录的源语言的文本翻译为目标语言的文本。语音合成装置108与翻译装置107相连,用于将翻译装置107所翻译的目标语言的文本转换为输出语音信号,并输出给外部交换机。语音识别技术通常是基于词汇、短语或较短句子来进行的。如图I所示,切分器104与外部交换机相连,其用于将来自外部交换机的输入语音信号切分为一个或多个音频文件。由此,其把连续大段的通话切分为较短的语句。这样,后续的语音识别处理可以针对切分后的数据进行,大大提高了处理精度。这有效保证了通话即时翻译的质量。根据本专利技术的一个优选实施例,切分器104可以分为检测单元和分割单元,其中,检测单元用于检测输入语音信号中的静音部分,而分割部分用于基于所检测的静音部分将输入语音信号切分为一个或多个音频文件。图2不出了根据本专利技术一个优选实施例的输入语音信号的示意图。如图2所示,可以在输入语音信号中检测出静音部分,然后基于检测到的静音部分将输入语音信号切分为一个或多个音频文件静音是通话中的必不可少的部分,基于静音部分来切分语音信号可以更好地表达说话者的本文档来自技高网...

【技术保护点】
一种通话即时翻译系统,包括切分器、语音识别装置、翻译装置和语音合成装置,其中,所述切分器用于连接到交换机并将输入语音信号切分为一个或多个音频文件;所述语音识别装置与所述切分器相连,用于将所述一个或多个音频文件转录为源语言的文本;所述翻译装置与所述语音识别装置相连,用于将所述源语言的文本翻译为目标语言的文本;以及所述语音合成装置与所述翻译装置相连,用于将所述目标语言的文本转换为输出语音信号,并输出给所述交换机。

【技术特征摘要】
1.一种通话即时翻译系统,包括切分器、语音识别装置、翻译装置和语音合成装置,其中, 所述切分器用于连接到交换机并将输入语音信号切分为一个或多个音频文件; 所述语音识别装置与所述切分器相连,用于将所述一个或多个音频文件转录为源语言的文本; 所述翻译装置与所述语音识别装置相连,用于将所述源语言的文本翻译为目标语言的文本;以及 所述语音合成装置与所述翻译装置相连,用于将所述目标语言的文本转换为输出语音信号,并输出给所述交换机。2.根据权利要求I所述的系统,其特征在于,所述系统还包括 存储器,其连接在所述切分器和所述语音识别装置之间; 其中,所述切分器还用于将所述一个或多个音频文件存储至所述存储器;并且 所述语音识别装置所转录的所述一个或多个音频文件来自于所述存储器。3.根据权利要求I所述的系统,其特征在于,所述系统还包括 语言确定装置,其与所述切分器相连,用于确定通话双方使用的语言; 其中,所述通话双方使用的语言中的一种作为所述源语言,另一种作为所述目标语言。4.根据权利要求I所述的系统,其特征在于,所述系统还包括 输入接口,用于从所述交换机接收所述输入语音信号;以及 输出接口,用于输出所述输出语音信号至所述交换机。5.根据权利要求I所述的系统,其特征在于,所述切分器进一步包括 检测单元,用于检测所述输入语音信号中的静音部分;以及 分割单元,用于基于所检测的静音部分将所述输入语音信号切分为所述一个或多个音频文件。6.根据权利要求5所述的系统,其特征在于,所述静音部分包括在O.6秒或O. 6秒以上的时间段内分贝值小于或等于噪声阈值的部分。7.根据权利要求I所述的系统,其特征在于,所述系统还包括 自动增益控制器,其与所述切分器相连,用于并对所述输入语音信号进行增益控制。8.根据权利要求7所述的系统,其特征在于,所述自动增益控制器进一步包括 放大单元,用于将分贝值小于设定值的所述输入语音信号放大至所述设定值;以及 缩小单元,用于将分贝值大于所述设定值的所述输...

【专利技术属性】
技术研发人员:钟实刘鹤袁首鹏
申请(专利权)人:ITP创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1