语音翻译方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37177990 阅读:16 留言:0更新日期:2023-04-20 22:45
本发明专利技术提供一种语音翻译方法、装置、电子设备和存储介质,其中方法包括:获取待翻译的用户语音;基于用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。本发明专利技术提供的方法、装置、电子设备和存储介质,通过在获取到待翻译的用户语音之后,基于用户语音中各语种的分词数量确定语种翻译方向以实现语音翻译,在解决多语种混讲场景下的语种适应问题,减轻用户操作负担,提高语音翻译的灵活性的同时,大大降低了语音翻译的时延,提高了语音翻译的响应速度。应速度。应速度。

【技术实现步骤摘要】
语音翻译方法、装置、电子设备和存储介质


[0001]本专利技术涉及语音翻译
,尤其涉及一种语音翻译方法、装置、电子设备和存储介质。

技术介绍

[0002]语音翻译是将一种语种的语音转化为另一种语种的文本的技术,语音翻译的存在,为实现跨语种的沟通交流提供了条件。
[0003]但是,在实际应用中,常常存在多语种混讲的情况,即,一个说话人可能时而用语种A交流,时而用语种B交流。为了适应多语种混讲,目前的语音翻译通常应用在采集到用户语音之后,先行根据用户语音进行语种识别,再基于识别所得的语种调用相应的引擎进行语音识别和文本翻译。
[0004]上述方案虽然能够适应多语种混讲的场景,但是对用户语音进行语种识别,需要缓存一定时长的语音,对于后续的语音识别、文本翻译,均会增加明显的延迟,影响语音翻译的响应速度。

技术实现思路

[0005]本专利技术提供一种语音翻译方法、装置、电子设备和存储介质,用以解决现有技术中多语种混讲场景下语音翻译时延大的缺陷。
[0006]本专利技术提供一种语音翻译方法,包括:
[0007]获取待翻译的用户语音;
[0008]基于所述用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;
[0009]基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。
[0010]根据本专利技术提供的一种语音翻译方法,所述基于所述用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向,包括:
[0011]基于所述各语种在所述识别文本中的分词数量以及所述识别文本中的标点符号的数量,或者,基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种;
[0012]基于所述文本语种,确定所述语种翻译方向。
[0013]根据本专利技术提供的一种语音翻译方法,所述基于所述各语种在所述识别文本中的分词数量以及所述识别文本中的标点符号的数量,确定所述识别文本对应的文本语种,包括:
[0014]在至少两个语种的分词数量非零,且所述标点符号的数量非零的情况下,基于所述标点符号对所述识别文本进行切分,并将切分后的识别文本作为所述识别文本;
[0015]基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语
种。
[0016]根据本专利技术提供的一种语音翻译方法,所述基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种,包括:
[0017]基于所述各语种在所述识别文本中的分词数量,确定分词数量的最大值;
[0018]基于所述最大值对应的语种,确定所述文本语种。
[0019]根据本专利技术提供的一种语音翻译方法,所述基于所述最大值对应的语种,确定所述文本语种,包括:
[0020]在所述最大值对应至少两个语种的情况下,基于与所述用户语音属于同一说话人的历史语音对应的历史语种,确定所述文本语种。
[0021]根据本专利技术提供的一种语音翻译方法,所述基于所述文本语种,确定所述语种翻译方向,包括:
[0022]基于各语种的预设翻译方向,和/或,所述用户语音所属说话人所对应会话人语音的语种,确定所述文本语种对应的语种翻译方向。
[0023]根据本专利技术提供的一种语音翻译方法,所述基于各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种,包括:
[0024]在所述识别文本为句首文本的情况下,基于各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种;
[0025]在所述识别文本非句首文本的情况下,将与所述识别文本属于同一句子的句首文本对应的语种翻译方向,作为所述识别文本对应的文本语种。
[0026]本专利技术还提供一种语音翻译装置,包括:
[0027]获取单元,用于获取待翻译的用户语音;
[0028]方向确定单元,用于基于所述用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;
[0029]翻译单元,用于基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音翻译方法。
[0030]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音翻译方法。
[0031]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音翻译方法。
[0032]本专利技术提供的语音翻译方法、装置、电子设备和存储介质,通过在获取到待翻译的用户语音之后,基于用户语音中各语种的分词数量确定语种翻译方向以实现语音翻译,在解决多语种混讲场景下的语种适应问题,减轻用户操作负担,提高语音翻译的灵活性的同时,大大降低了语音翻译的时延,提高了语音翻译的响应速度。
附图说明
[0033]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一
些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是本专利技术提供的语音翻译方法的流程示意图之一;
[0035]图2是本专利技术提供的语种翻译方向的确定方法的流程示意图;
[0036]图3是本专利技术提供的语音翻译方法的流程示意图之二;
[0037]图4是本专利技术提供的语音翻译装置的结构示意图;
[0038]图5是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0039]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]目前,针对于语音翻译下多语种混讲的情况,常用的适应方案有两种,一种是用户指定语种方向和翻译方向,在使用过程中,不支持语种的动态切换,同时每次使用都需要指定语种,该种方案灵活性较差,且用户操作也相对麻烦。另一种是在采集到用户语音之后,先行根据用户语音进行语种识别,再基于识别所得的语种调用相应的引擎进行语音识别和文本翻译,该种方案需要缓存一定时长的语音方能实现语种识别,对于后续的语音识别、文本翻译,均会增加明显的延迟。
[0041]针对上述问题,本专利技术实施例提供一种语音翻译方法,在避免用户频繁操作造成体验降低的同时,能够有效提高语音翻译的响应速度。
[0042]图1是本专利技术提供的语音翻译方法的流程示意图,如图1所示,该方法包括:
[0043]步骤110,获取待翻译的用户语音。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音翻译方法,其特征在于,包括:获取待翻译的用户语音;基于所述用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向;基于所述语种翻译方向,对所述用户语音进行翻译,得到所述用户语音的翻译文本。2.根据权利要求1所述的语音翻译方法,其特征在于,所述基于所述用户语音中各语种的分词数量,确定所述用户语音对应的语种翻译方向,包括:基于所述各语种在所述识别文本中的分词数量以及所述识别文本中的标点符号的数量,或者,基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种;基于所述文本语种,确定所述语种翻译方向。3.根据权利要求2所述的语音翻译方法,其特征在于,所述基于所述各语种在所述识别文本中的分词数量以及所述识别文本中的标点符号的数量,确定所述识别文本对应的文本语种,包括:在至少两个语种的分词数量非零,且所述标点符号的数量非零的情况下,基于所述标点符号对所述识别文本进行切分,并将切分后的识别文本作为所述识别文本;基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种。4.根据权利要求2或3所述的语音翻译方法,其特征在于,所述基于所述各语种在所述识别文本中的分词数量,确定所述识别文本对应的文本语种,包括:基于所述各语种在所述识别文本中的分词数量,确定分词数量的最大值;基于所述最大值对应的语种,确定所述文本语种。5.根据权利要求4所述的语音翻译方法,其特征在于,所述基于所述最大值对应的语种,确定所述文本语种,包括:在所述最...

【专利技术属性】
技术研发人员:龙明康刘坤黄元举彭英伦刘平平
申请(专利权)人:广州市讯飞樽鸿信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1