基于会议的翻译方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39316926 阅读:6 留言:0更新日期:2023-11-12 15:59
本发明专利技术公开了一种基于会议的翻译方法、装置、存储介质及电子设备。涉及人工智能技术领域。其中,该方法包括:获取目标对象的目标音频流,其中,目标音频流包括:在会议进行过程中由目标对象发言时产生的音频;将目标音频流输入转写翻译模型,输出译文文本和翻译状态,其中,转写翻译模型用于将目标音频流翻译为指定语言的文本,翻译状态用于表示译文文本中语句完整性的翻译结果;将译文文本和翻译状态展示在指定屏幕上。本发明专利技术解决了相关技术中在多语言会议过程中,采用人工的方式进行同声传译,翻译精准度低的技术问题。译精准度低的技术问题。译精准度低的技术问题。

【技术实现步骤摘要】
基于会议的翻译方法、装置、存储介质及电子设备


[0001]本专利技术涉及人工智能
,具体而言,涉及一种基于会议的翻译方法、装置、存储介质及电子设备。

技术介绍

[0002]在多语言的会议中,为了会议过程中更高效的交流,需要精通多语言的同声传译人员在会议过程中实时将会议内容翻译,这个过程可以概括为“听取会议内容、翻译、口述”,时效性要求较高,且要求同声传译人员拥有较为丰富的经验知识、甚至还要求一定的领域知识。
[0003]因此,在多语言的会议交流过程中,基于同声传译的方式进行沟通交流,人力成本较高,且可能由于不同的同声传译人员经验的不同(包括但不限于领域知识),存在不同传译人员间出现“词不达意”的情况,并且同声传译后为语音流,未将传译结果进行保存不便于后续跟踪、会议记录总结等。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种基于会议的翻译方法、装置、存储介质及电子设备,以至少解决相关技术中在多语言会议过程中,采用人工的方式进行同声传译,翻译精准度低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种基于会议的翻译方法,包括:获取目标对象的目标音频流,其中,所述目标音频流包括:在会议进行过程中由目标对象发言时产生的音频;将所述目标音频流输入转写翻译模型,输出译文文本和翻译状态,其中,所述转写翻译模型用于将所述目标音频流翻译为指定语言的文本,所述翻译状态用于表示所述译文文本中语句的完整性;将所述译文文本和所述翻译状态展示在指定屏幕上。
[0007]进一步地,在将所述译文文本和所述翻译状态展示在指定屏幕上之后,还包括:获取所述会议的会议信息和会议内容,其中,所述会议信息包括下述至少之一:会议开始时刻、会议时长,所述会议内容至少包括:所述译文文本;对所述会议信息和所述会议内容进行存档处理,其中,所述存档处理的处理方式包括:将所述会议信息和所述会议内容存储至数据库。
[0008]进一步地,将所述译文文本和所述翻译状态展示在指定屏幕上,包括:基于所述目标对象的音色或所述目标对象所使用的麦克风信息,获取所述目标对象的角色信息,其中,所述角色信息包括:所述目标对象在所述会议中的角色;将所述角色信息、所述译文文本和所述翻译状态展示在所述屏幕上。
[0009]进一步地,将所述目标音频流输入转写翻译模型,输出译文文本和翻译状态,包括:将所述目标音频流的格式转换为目标格式,得到第一音频流,其中,所述目标格式至少包括:二进制格式;将所述第一音频流输入所述转写翻译模型,输出所述译文文本和所述翻
译状态。
[0010]进一步地,将所述第一音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态,包括:将所述第一音频流切分为指定长度的N个子音频流,得到音频流集合,其中,N为正整数;基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态。
[0011]进一步地,在基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型之后,还包括:对N个所述子音频流进行拼接处理,得到第二音频流;通过所述转写翻译模型对所述第二音频流进行翻译转写,得到所述译文文本,其中,所述转写翻译表示将音频流中的语言翻译为所述指定语言的文本。
[0012]进一步地,在通过所述转写翻译模型对所述第二音频流进行翻译转写过程中,还包括:基于历史时刻进行转写翻译的语句的语速和当前时刻进行转写翻译的语句的语速,计算当前时刻进行转写翻译的语句对应的加速度,其中,所述历史时刻在所述当前时刻之前;在所述加速度超过预设加速度阈值的情况下,确定当前时刻进行转写翻译的语句的翻译状态为翻译完整;在所述加速度未超过预设加速度阈值的情况下,确定当前时刻进行转写翻译的语句的翻译状态为未翻译完整。
[0013]进一步地,获取目标对象的目标音频流,包括:基于所述目标对象所使用的麦克风,获取所述目标对象的原始音频流;对所述原始音频流进行预处理,得到所述目标音频流,其中,所述预处理的处理方式包括下述至少之一:降噪、特征增强。
[0014]根据本专利技术实施例的另一方面,还提供了一种基于会议的翻译装置,包括:第一获取单元,用于获取目标对象的目标音频流,其中,所述目标音频流包括:在会议进行过程中由目标对象发言时产生的音频;处理单元,用于将所述目标音频流输入转写翻译模型,输出译文文本和翻译状态,其中,所述转写翻译模型用于将所述目标音频流翻译为指定语言的文本,所述翻译状态用于表示所述译文文本中语句的完整性;展示单元,用于将所述译文文本和所述翻译状态展示在指定屏幕上。
[0015]进一步地,基于会议的翻译装置还包括:第二获取单元,用于在将所述译文文本和所述翻译状态展示在指定屏幕上之后,获取所述会议的会议信息和会议内容,其中,所述会议信息包括下述至少之一:会议开始时刻、会议时长,所述会议内容至少包括:所述译文文本;存档单元,用于对所述会议信息和所述会议内容进行存档处理,其中,所述存档处理的处理方式包括:将所述会议信息和所述会议内容存储至数据库。
[0016]进一步地,展示单元包括:第一获取子单元,用于基于所述目标对象的音色或所述目标对象所使用的麦克风信息,获取所述目标对象的角色信息,其中,所述角色信息包括:所述目标对象在所述会议中的角色;展示子单元,用于将所述角色信息、所述译文文本和所述翻译状态展示在所述屏幕上。
[0017]进一步地,处理单元包括:转换子单元,用于将所述目标音频流的格式转换为目标格式,得到第一音频流,其中,所述目标格式至少包括:二进制格式;处理子单元,用于将所述第一音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态。
[0018]进一步地,处理子单元包括:切分模块,用于将所述第一音频流切分为指定长度的N个子音频流,得到音频流集合,其中,N为正整数;处理模块,用于基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态。
[0019]进一步地,处理子单元还包括:拼接模块,用于在基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型之后,对N个所述子音频流进行拼接处理,得到第二音频流;转写模块,用于通过所述转写翻译模型对所述第二音频流进行翻译转写,得到所述译文文本,其中,所述转写翻译表示将音频流中的语言翻译为所述指定语言的文本。
[0020]进一步地,处理子单元还包括:计算模块,用于在通过所述转写翻译模型对所述第二音频流进行翻译转写过程中,基于历史时刻进行转写翻译的语句的语速和当前时刻进行转写翻译的语句的语速,计算当前时刻进行转写翻译的语句对应的加速度,其中,所述历史时刻在所述当前时刻之前;第一确定模块,用于在所述加速度超过预设加速度阈值的情况下,确定当前时刻进行转写翻译的语句的翻译状态为翻译完整;第二确定模块,用于在所述加速度未超过预设加速度阈值的情况下,确定当前时刻进行转写翻译的语句的翻译状态为未翻译完整。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于会议的翻译方法,其特征在于,包括:获取目标对象的目标音频流,其中,所述目标音频流包括:在会议进行过程中由目标对象发言时产生的音频;将所述目标音频流输入转写翻译模型,输出译文文本和翻译状态,其中,所述转写翻译模型用于将所述目标音频流翻译为指定语言的文本,所述翻译状态用于表示所述译文文本中语句的完整性;将所述译文文本和所述翻译状态展示在指定屏幕上。2.根据权利要求1所述的翻译方法,其特征在于,在将所述译文文本和所述翻译状态展示在指定屏幕上之后,还包括:获取所述会议的会议信息和会议内容,其中,所述会议信息包括下述至少之一:会议开始时刻、会议时长,所述会议内容至少包括:所述译文文本;对所述会议信息和所述会议内容进行存档处理,其中,所述存档处理的处理方式包括:将所述会议信息和所述会议内容存储至数据库。3.根据权利要求1所述的翻译方法,其特征在于,将所述译文文本和所述翻译状态展示在指定屏幕上,包括:基于所述目标对象的音色或所述目标对象所使用的麦克风信息,获取所述目标对象的角色信息,其中,所述角色信息包括:所述目标对象在所述会议中的角色;将所述角色信息、所述译文文本和所述翻译状态展示在所述屏幕上。4.根据权利要求1所述的翻译方法,其特征在于,将所述目标音频流输入转写翻译模型,输出译文文本和翻译状态,包括:将所述目标音频流的格式转换为目标格式,得到第一音频流,其中,所述目标格式至少包括:二进制格式;将所述第一音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态。5.根据权利要求4所述的翻译方法,其特征在于,将所述第一音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态,包括:将所述第一音频流切分为指定长度的N个子音频流,得到音频流集合,其中,N为正整数;基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型,输出所述译文文本和所述翻译状态。6.根据权利要求5所述的翻译方法,其特征在于,在基于预设传输速率,将所述音频流集合中的子音频流输入所述转写翻译模型之后,还包括:对N个所述子音...

【专利技术属性】
技术研发人员:刘涛
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1