通话中的翻译制造技术

技术编号：14693930 阅读：44 留言：0更新日期：2017-02-23 16:53

经由通信系统的通信网络从源用户的远程源用户设备接收讲源语言的源用户与讲目标语言的目标用户之间的通话的通话音频，该通话音频包括以源语言的源用户话音。对该通话音频执行自动话音识别过程。使用话音识别过程的结果来以目标语言生成对该源用户的话音的翻译。将该源用户的话音的经翻译的合成话音音频版本与源用户的通话话音进行混合和/或与目标用户的话音的以源语言的经翻译的音频进行混合。将经混合音频信号经由该通信网络发送给目标用户的远程目标用户设备以用于在该通话期间向至少该目标用户输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
通信系统允许用户通过通信网络相互通信，例如通过在网络上进行通话。该网络可以是例如互联网或公共交换电话网络(PSTN)。在通话期间，可以在网络的节点之间传输音频和/或视频信号，从而允许用户通过该通信网络在通信会话中相互发送和接收音频数据(例如，话音)和/或视频数据(例如，网络摄像头视频)。这样的通信系统包括互联网协议语音或视频(VoIP)系统。为了使用VoIP系统，用户在用户设备上安装并执行客户端软件。该客户端软件建立VoIP连接并且提供诸如注册和用户认证之类的其他功能。除了语音通信，该客户端还可以针对通信模式而建立连接，例如，向用户提供即时消息传送(“IM”)、SMS消息传送、文件转移和语音信箱服务。
技术实现思路
提供了该
技术实现思路
以用简化的形式介绍在以下的具体实施方式中所进一步描述的概念的选择。该
技术实现思路
不旨在标识所要求保护的主题的关键特征或本质特征，也不旨在用于限制所要求保护的主题的范围。根据第一方面，公开了用于在通信系统中使用的语言翻译中继系统。通信系统用于实现至少讲源语言的源用户与讲目标语言的目标用户之间的语音或视频通话。中继系统包括输入端、话音识别组件、翻译组件、输出组件、以及混合组件。所述输入端被配置为经由所述通信系统的通信网络接收来自源用户的远程源用户设备的通话的通话音频。所述通话音频包括源用户的以源语言的话音。所述话音识别组件被配置为对所述通话音频执行自动话音识别过程。所述翻译组件被配置为使用所述话音识别过程的结果来生成以目标语言的对源用户的话音翻译。所述翻译包括用于在目标用户设备处播放的对源用户的话音的以目标语言的经翻译的合成话...
<a href="http://www.xjishu.com/zhuanli/62/201580027476.html" title="通话中的翻译原文来自X技术">通话中的翻译</a>

【技术保护点】
一种用于在通信系统中使用的语言翻译中继系统，所述通信系统用于实现至少讲源语言的源用户与讲目标语言的目标用户之间的语音或视频通话，所述中继系统包括：输入端，其被配置为经由所述通信系统的通信网络从所述源用户的远程源用户设备接收所述通话的通话音频，所述通话音频包括以所述源话音的所述源用户的话音；话音识别组件，其被配置为对所述通话音频执行自动话音识别过程；翻译组件，其被配置为使用所述话音识别过程的结果来生成对所述源用户的话音的以所述目标语言的翻译，所述翻译包括用于在所述目标用户设备处播放的所述源用户的话音的以所述目标语言的经翻译的合成话音音频版本，所述合成话音是基于所述话音识别过程的所述结果来生成的；混合组件，其被配置为将所述合成话音与所述源用户的通话音频进行混合和/或与所述目标用户的话音的以所述源语言的经翻译的音频进行混合，从而生成经混合的音频信号；以及输出端，其被配置为经由所述通信网络将所述经混合的音频信号发送至至少所述目标用户的远程目标用户设备，以用于在所述通话期间输出给所述目标用户。

【技术特征摘要】
【国外来华专利技术】2014.05.27 US 62/003,380;2015.02.11 US 14/620,1421.一种用于在通信系统中使用的语言翻译中继系统，所述通信系统用于实现至少讲源语言的源用户与讲目标语言的目标用户之间的语音或视频通话，所述中继系统包括：输入端，其被配置为经由所述通信系统的通信网络从所述源用户的远程源用户设备接收所述通话的通话音频，所述通话音频包括以所述源话音的所述源用户的话音；话音识别组件，其被配置为对所述通话音频执行自动话音识别过程；翻译组件，其被配置为使用所述话音识别过程的结果来生成对所述源用户的话音的以所述目标语言的翻译，所述翻译包括用于在所述目标用户设备处播放的所述源用户的话音的以所述目标语言的经翻译的合成话音音频版本，所述合成话音是基于所述话音识别过程的所述结果来生成的；混合组件，其被配置为将所述合成话音与所述源用户的通话音频进行混合和/或与所述目标用户的话音的以所述源语言的经翻译的音频进行混合，从而生成经混合的音频信号；以及输出端，其被配置为经由所述通信网络将所述经混合的音频信号发送至至少所述目标用户的远程目标用户设备，以用于在所述通话期间输出给所述目标用户。2.根据权利要求1所述的语言翻译中继系统，其中，所述通信系统的用户是由相关联的用户标识符唯一地标识的，所述中继系统被配置为实现翻译器代理，所述翻译器代理也是由相关联的用户标识符唯一地标识的，从而促进与所述代理的通信，大体上就像它是所述通信系统的另一个用户一样；其中，所述翻译器代理配置为：响应于请求所述翻译器代理参与所述通话的翻译请求，而在参与所述通话的同时实现所述话音识别过程以及所述翻译的生成。3.根据权利要求1或2所述的语言翻译中继系统，其中，所述翻译还包括用于在所述目标用户设备处显示的和/或用于在所述目标用户设备处转换成合成话音的、所述源用户的话音的以所述目标语言的经翻译的文本版本，所述目标语言文本是基于所述话音识别过程的所述结果生成的，其中，所述输出端还被配置为将所述经翻译的文本版本发送至所述目标用户设备。4.根据权利要求1、2、或3所述的语言中继翻译系统是由所述通信网络的一个或多个服务器实施的。5.根据前述任何一项权利要求所述的语言翻译中继系统，包括进一步的输入端，所述进一步的输入端被配置为经由所述网络从所述目标用户设备接收所述通话的进一步的通话音频，所述进一步的通话音频包括以所述目标语言的所述目标用户的话音；其中，所述通话音频和所述进一步的通话音频是作为分离的音频信号接收的，并且所述中继系统被配置为与所述源用户的话音的所述翻译分离地生成待发送给所述源用户的、对所述目标用户的话音的以所述源语言的进一步的翻译。6.根据权利要求5所述的语言翻译系统，其中，所述通话具有作为额外的参与者的讲第三语言的至少第三用户，所述翻译器中继系统被配置为与对所述源用户的话音和所述目标用户的话音的所述翻译分离地生成待发送给至少所述源用户的、对所述第三用户的话音的以所述源语言的第三翻译和/或待发送给至少所述目标用户的、对所述第三用户的话音的以所述目标语言的第四翻译。7.根据前述任何一项权利要求所述的语言翻译中继系统，包括另一个输出端，其被配置为将与所述话音识别过程的所述结果相关的信息发送给所述源用户的所述源用户设备和/或所述目标用户的所述目标用户设备。8.根据权利要求7所述的语言中继翻译系统，包括另一个输入端，其连接以经由所述网络从所述源用户的所述源用户设备接收反馈数据，所述反馈数据传达与所述话音识别过程的所述结果相关的源用户反馈，其中，所述话音识别组件是基于所接收到的反馈数据来配置的。9.一种在通信系...

【专利技术属性】
技术研发人员：A·奥厄，A·A·梅内塞斯，J·N·林德布鲁姆，F·富雷斯乔，P·P·N·格雷博里奥，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人