同声传译处理方法、装置及设备制造方法及图纸

技术编号：22058711 阅读：20 留言：0更新日期：2019-09-07 16:34

本发明专利技术提出了一种同声传译处理方法、装置及设备，其中，方法包括：获取第一语种的语音识别结果，并对语音识别结果进行切词处理，生成切词结果；依次接收切词结果，当接收到的切词结果的个数等于预设值K时，将接收到的切词结果输入到预先训练的从第一语种文本到第二语种文本的翻译模型中进行处理，解码出第一个翻译结果，其中，K为正整数；接收第P个切词结果，将第P个切词结果输入到翻译模型中进行处理，解码出第P‑K+1个翻译结果，其中，P大于K且P为整数。由此，降低了同声传译的翻译延时，将延时控制在词级别。

Simultaneous Interpretation Processing, Devices and Equipment

全部详细技术资料下载

【技术实现步骤摘要】
同声传译处理方法、装置及设备
本专利技术涉及人工智能
，尤其涉及一种同声传译处理方法、装置及设备。
技术介绍
目前，同声传译在各种会议、传媒活动、广播授课等领域被广泛使用。同声传译是对语音识别技术和机器翻译技术的一大挑战，评价同声传译的效果需要综合考量翻译的延时和准确率。相关技术中的同声传译系统，通常基于对语音识别结果的断句和加标点结果调用翻译，导致翻译结果比语音识别要延时一到多个子句，延时较高。
技术实现思路
为此，本专利技术的第一个目的在于提出一种同声传译处理方法，通过对语音识别结果进行切词，并控制延时K个词翻译，解决了相关技术中同声传译翻译延时较高的问题，降低了同声传译的翻译延时，将延时控制在词级别。本专利技术的第二个目的在于提出一种同声传译处理装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种计算机可读存储介质。本专利技术第一方面实施例提出了一种同声传译处理方法，包括：获取第一语种的语音识别结果，并对所述语音识别结果进行切词处理，生成切词结果；依次接收所述切词结果，当接收到的所述切词结果的个数等于预设值K时，将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理，解码出第一个翻译结果，其中，K为正整数；接收第P个切词结果，将所述第P个切词结果输入到所述翻译模型中进行处理，解码出第P-K+1个翻译结果，其中，P大于K且P为整数。本专利技术实施例的同声传译处理方法，通过获取第一语种的语音识别结果，并对语音识别结果进行切词处理，生成切词结果。进而，依次接收切词结果，当接收到的切...

【技术保护点】
1.一种同声传译处理方法，其特征在于，包括：获取第一语种的语音识别结果，并对所述语音识别结果进行切词处理，生成切词结果；依次接收所述切词结果，当接收到的所述切词结果的个数等于预设值K时，将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理，解码出第一个翻译结果，其中，K为正整数；接收第P个切词结果，将所述第P个切词结果输入到所述翻译模型中进行处理，解码出第P‑K+1个翻译结果，其中，P大于K且P为整数。

【技术特征摘要】
1.一种同声传译处理方法，其特征在于，包括：获取第一语种的语音识别结果，并对所述语音识别结果进行切词处理，生成切词结果；依次接收所述切词结果，当接收到的所述切词结果的个数等于预设值K时，将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理，解码出第一个翻译结果，其中，K为正整数；接收第P个切词结果，将所述第P个切词结果输入到所述翻译模型中进行处理，解码出第P-K+1个翻译结果，其中，P大于K且P为整数。2.如权利要求1所述的方法，其特征在于，在接收第P个切词结果之后，还包括：判断所述第P个切词结果是否为标点；若是，则根据所述翻译模型对所述切词结果进行处理，连续解码出翻译结果直至目标子句翻译结束。3.如权利要求1所述的方法，其特征在于，在将所述接收到的所述切词结果输入到预先训练的从所述第一语种文本到第二语种文本的翻译模型中进行处理之前，还包括：获取第一语种的文本语料和对应的第二语种的文本语料作为训练集；根据所述训练集训练预设模型的处理参数，生成所述翻译模型。4.如权利要求3所述的方法，其特征在于，在所述翻译模型的编码器端生成隐层向量表示时，根据当前输入词语与之前输入词语进行意图计算。5.如权利要求2所述的方法，其特征在于，在连续解码出翻译结果直至目标子句翻译结束之后，还包括：获取当前待翻译子句的第一语音识别结果，确定与所述第一语音识别结果对应的所述目标子句的第二语音识别结果，以及与所述第二语音识别结果对应的目标翻译结果；将所述第一语音识别结果和所述第二语音识别结果合并，获取合并后的语音识别结果；根据所述合并后的语音识别结果和所述目标翻译结果，获取所述第一语音识别结果对应的翻译结果。6.一种同声传译处理装置，其特征在于，包括：切词模块，用于获取第一语种的语音识别结果，并对所述语音识别结果进行切词处理，生成切词结果...

【专利技术属性】
技术研发人员：张传强，毕天驰，徐梓翔，熊皓，何中军，李芝，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人