语音翻译文本校正系统、方法、装置及设备制造方法及图纸

技术编号:30632478 阅读:10 留言:0更新日期:2021-11-04 00:03
本申请公语音翻译文本校正系统、方法、装置及相关设备。其中,所述系统通过服务端确定与客户端实时采集的语音流数据对应的源语言文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后第一子句文本,确定与第一子句文本对应的目标语言第二子句文本,将第二子句文本发送至客户端;客户端实时采集语音流数据,发送语音流数据;以及,显示文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。采用这种处理方式,使得随着实时语音识别进度,对原文子句文本进行人工校正,并在一句话识别完成前,对经过人工校正的原文子句文本进行翻译,实现子句粒度的翻译文本校正处理;因此,可以有效提升校正效率和校正质量。和校正质量。和校正质量。

【技术实现步骤摘要】
语音翻译文本校正系统、方法、装置及设备


[0001]本申请涉及机器语音翻译
,具体涉及语音翻译文本校正系统、方法和装置,以及电子设备。

技术介绍

[0002]随着信息国际化时代的到来和各种社会需求的日渐迫切,语音自动翻译技术研究受到越来越广泛的关注。语音翻译又常被称为口语翻译(Spoken Language Translation,SLT),就是让计算机实现从一种语言的语音到另一种语言的语音翻译的过程。
[0003]语音翻译是一种语音识别结合机器翻译的技术。在实时语音识别结合机器翻译(同声传译)的场景中,由于技术、环境和人为等因素的影响,会导致语音识别结果不准确,进而导致翻译结果错误,因此需要人工介入对识别结果和翻译结果做实时性的干预修正。在实时识别场景中,由于节奏快且时间短,所以完全由人工进行干预的难度较大。目前,一种典型的语音翻译结果校正方式是,先通过实时语音翻译模型对语音进行识别、翻译,并将翻译结果实时显示在屏幕上,待一整句翻译完成后,再对该句语音翻译结果进行自动化的干预处理,然后再由人工进行干预处理。
[0004]然而,在实现本专利技术过程中,专利技术人发现现有技术至少存在如下问题:由于需要在一整句翻译完成后,再对语音翻译结果进行自动化的干预处理,且只具备简单的翻译结果干预能力,因此对语音翻译结果进行自动化干预的速度较慢,进而导致人工干预接入时机较晚,从而导致错误翻译字幕在屏幕上停留时间较长,并且翻译文本校正质量较差。因此,如何提升对语音翻译结果的整体校正效率及校正质量,以缩短错误翻译字幕在屏幕上停留时间、提升翻译质量,以成为本领域技术人员需要迫切解决的问题。

技术实现思路

[0005]本申请提供语音翻译文本校正系统,以解决现有技术存在的语音翻译文本校正质量和校正效率均较低的问题。本申请另外提供语音翻译文本校正方法和装置,以及电子设备。
[0006]本申请提供一种语音翻译文本校正系统,包括:
[0007]服务端,用于确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后的第一子句文本,确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端;
[0008]客户端,用于实时采集语音流数据,发送语音流数据;以及,显示所述文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。
[0009]本申请还提供一种语音翻译文本校正方法,包括:
[0010]确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;
[0011]接收客户端发送的人工校正后的第一子句文本;
[0012]确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端。
[0013]可选的,还包括:
[0014]对第一子句文本执行校正处理,作为校正后的第三子句文本;
[0015]所述确定与第一子句文本对应的目标语言的第二子句文本,包括:
[0016]确定与第三子句文本对应的所述第二子句文本。
[0017]可选的,所述对第一子句文本执行校正处理,包括:
[0018]对所述第一子句文本执行方言校正处理。
[0019]可选的,所述对第一子句文本执行校正处理,包括:
[0020]根据实体词替换规则信息,对第一子句文本执行实体词替换处理。
[0021]可选的,所述实体词替换规则包括:人名替换规则,企业实体名替换规则。
[0022]可选的,所述对第一子句文本执行校正处理,包括:
[0023]根据黑名单过滤规则信息,对第一子句文本执行黑名单过滤处理。
[0024]可选的,还包括:
[0025]对第二子句文本执行校正处理。
[0026]可选的,还包括:
[0027]根据热词信息,优化语音识别模型和/或语音翻译模型。
[0028]可选的,还包括:
[0029]确定所述第二子句文本包括的译文不确定的词、及所述译文不确定的词的多个候选译文词;
[0030]向客户端发送所述译文不确定的词和候选译文词,以便于客户端用户根据候选译文词,修改所述译文不确定的词。
[0031]可选的,根据相似词表,确定所述译文不确定的词和所述多个候选译文词。
[0032]本申请还提供一种语音翻译文本校正方法,包括:
[0033]实时采集语音流数据,将语音流数据发送至服务端;
[0034]显示服务端回送的与语音流数据对应的源语言的文本片段;
[0035]确定人工校正后的第一子句文本,将第一子句文本发送至服务端;
[0036]显示服务端回送的与第一子句文本对应的目标语言的第二子句文本。
[0037]可选的,还包括:
[0038]确定与第二子句文本对应的人工校正后的第三子句文本;
[0039]将显示的第二子句文本更新为第三子句文本。
[0040]可选的,通过第一显示装置,执行人工校正原文处理;
[0041]通过第二显示装置,显示与语音进度对应的源语言文本和目标语言文本。
[0042]可选的,所述确定人工校正后的第一子句文本,包括:
[0043]确定第一显示装置中第二显示装置已经显示完成的源语言的历史文本;
[0044]将第一显示装置显示的所述已经显示完成的源语言的历史文本调整为第三显示属性。
[0045]可选的,所述确定人工校正后的第一子句文本,包括:
[0046]根据调整的标点符号,调整所述第一子句文本。
[0047]可选的,所述确定人工校正后的第一子句文本,包括:
[0048]根据单步回退指令,还原单步修改前的文本。
[0049]可选的,所述确定人工校正后的第一子句文本,包括:
[0050]根据句子回退指令,还原修改前的句子文本。
[0051]可选的,所述确定人工校正后的第一子句文本,包括:
[0052]以句子隔离方式,显示各个句子文本。
[0053]可选的,所述确定人工校正后的第一子句文本,包括:
[0054]以第一显示属性显示光标聚焦的句子文本,以第二显示属性显示非光标聚焦的句子文本。
[0055]可选的,所述确定人工校正后的第一子句文本,包括:
[0056]若执行文本选取操作,则显示文本处理快捷操作选项。
[0057]可选的,所述文本处理快捷操作选项包括:添加热词选项,添加实体词替换规则选项,人称代词快速切换选项,标点符号快速切换选项,划选文本区域删除选项,整句删除选项。
[0058]可选的,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:
[0059]以句子隔离方式,显示各个句子文本。
[0060]可选的,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:
[0061]以第一显示属性显示光标聚焦的目标语言的句本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音翻译文本校正系统,其特征在于,包括:服务端,用于确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;以及,接收客户端发送的人工校正后的第一子句文本,确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端;客户端,用于实时采集语音流数据,发送语音流数据;以及,显示所述文本片段,确定第一子句文本,发送第一子句文本;以及,显示第二子句文本。2.一种语音翻译文本校正方法,其特征在于,包括:确定与客户端实时采集的语音流数据对应的源语言的文本片段,将文本片段发送至客户端;接收客户端发送的人工校正后的第一子句文本;确定与第一子句文本对应的目标语言的第二子句文本,将第二子句文本发送至客户端。3.根据权利要求2所述的方法,其特征在于,还包括:对第一子句文本执行校正处理,作为校正后的第三子句文本;所述确定与第一子句文本对应的目标语言的第二子句文本,包括:确定与第三子句文本对应的所述第二子句文本。4.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:对所述第一子句文本执行方言校正处理。5.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:根据实体词替换规则信息,对第一子句文本执行实体词替换处理。6.根据权利要求5所述的方法,其特征在于,所述实体词替换规则包括:人名替换规则,企业实体名替换规则。7.根据权利要求3所述的方法,其特征在于,所述对第一子句文本执行校正处理,包括:根据黑名单过滤规则信息,对第一子句文本执行黑名单过滤处理。8.根据权利要求2所述的方法,其特征在于,还包括:对第二子句文本执行校正处理。9.根据权利要求2所述的方法,其特征在于,还包括:根据热词信息,优化语音识别模型和/或语音翻译模型。10.根据权利要求2所述的方法,其特征在于,还包括:确定所述第二子句文本包括的译文不确定的词、及所述译文不确定的词的多个候选译文词;向客户端发送所述译文不确定的词和候选译文词,以便于客户端用户根据候选译文词,修改所述译文不确定的词。11.根据权利要求10所述的方法,其特征在于,根据相似词表,确定所述译文不确定的词和所述多个候选译文词。12.一种语音翻译文本校正方法,其特征在于,包括:
实时采集语音流数据,将语音流数据发送至服务端;显示服务端回送的与语音流数据对应的源语言的文本片段;确定人工校正后的第一子句文本,将第一子句文本发送至服务端;显示服务端回送的与第一子句文本对应的目标语言的第二子句文本。13.根据权利要求12所述的方法,其特征在于,还包括:确定与第二子句文本对应的人工校正后的第三子句文本;将显示的第二子句文本更新为第三子句文本。14.根据权利要求12所述的方法,其特征在于,通过第一显示装置,执行人工校正原文处理;通过第二显示装置,显示与语音进度对应的源语言文本和目标语言文本。15.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:确定第一显示装置中第二显示装置已经显示完成的源语言的历史文本;将第一显示装置显示的所述已经显示完成的源语言的历史文本调整为第三显示属性。16.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据调整的标点符号,调整所述第一子句文本。17.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据单步回退指令,还原单步修改前的文本。18.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:根据句子回退指令,还原修改前的句子文本。19.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:以句子隔离方式,显示各个句子文本。20.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:以第一显示属性显示光标聚焦的句子文本,以第二显示属性显示非光标聚焦的句子文本。21.根据权利要求12所述的方法,其特征在于,所述确定人工校正后的第一子句文本,包括:若执行文本选取操作,则显示文本处理快捷操作选项。22.根据权利要求21所述的方法,其特征在于,所述文本处理快捷操作选项包括:添加热词选项,添加实体词替换规则选项,人称代词快速切换选项,标点符号快速切换选项,划选文本区域删除选项,整句删除选项。23.根据权利要求13所述的方法,其特征在于,所述确定与第二子句文本对应的人工校正后的第三子句文本,包括:以句子隔离方式,显示各个句子文本。
24.根据权利要求13...

【专利技术属性】
技术研发人员:曹宇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1