远程会议的同声传译方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26895279 阅读:27 留言:0更新日期:2020-12-29 16:20
本申请公开了一种远程会议的同声传译方法、装置、电子设备和存储介质,涉及语音交互领域。具体实现方案为:获取远程会议中的至少一个发言人的语音;根据语音以及参会人的接受语言,得到与语音对应的接受语言的同声传译字幕;根据发言人的数量,确定同声传译字幕的显示模式;根据显示模式,显示同声传译字幕。根据本申请实施例可以提高会议效率。

【技术实现步骤摘要】
远程会议的同声传译方法、装置、电子设备和存储介质
本申请涉及计算机
,尤其涉及语音交互领域。
技术介绍
会议是人们协同工作的重要方式。不同于日常的即时性沟通协作,会议强调特定的时间、地点及参与人群,然后解决特定的业务问题。远程会议突破了空间的界限,利用网络、设备,将声音、影像实时互传,实现远程协作。远程会议虽然已经突破了空间的界限,但受限于参会人所使用的语言种类、语言水平等因素,跨语言种类的会议沟通仍存在障碍。随着人工智能技术的快速发展,机器同声传译的质量日趋提升,因此,将同声传译功能嵌入远程会议中,成为业界的研究热点。
技术实现思路
本申请提供了一种远程会议的同声传译方法、装置、电子设备和存储介质。根据本申请的一方面,提供了一种远程会议的同声传译方法,包括:获取远程会议中的至少一个发言人的语音信息;根据语音信息以及参会人的接受语言,得到与语音信息对应的接受语言的同声传译字幕;根据发言人的数量,确定同声传译字幕的显示模式;根据显示模式,显示同声传译字幕。根据本申请的另一方面,提供了一种远程会议的同声传译装置,包括:语音获取模块,用于获取远程会议中的至少一个发言人的语音信息;字幕获取模块,用于根据语音信息以及参会人的接受语言,得到与语音信息对应的接受语言的同声传译字幕;模式确定模块,用于根据发言人的数量,确定同声传译字幕的显示模式;字幕显示模块,用于根据显示模式,显示同声传译字幕。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请实施例提供的方法。根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请实施例提供的方法。根据本申请的技术方案,可以提高会议效率。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请一实施例的远程会议的同声传译方法的示意图;图2是可以实现本申请实施例的远程会议的同声传译方法的场景图一;图3是根据本申请一实施例的会议页面的示意图一;图4是根据本申请一实施例的会议页面的示意图二;图5是可以实现本申请实施例的远程会议的同声传译方法的场景图二;图6是可以实现本申请实施例的远程会议的同声传译方法的场景图三;图7是根据本申请一实施例的远程会议的同声传译装置的示意图;图8是根据本申请另一实施例的远程会议的同声传译装置的示意图;图9是用来实现本申请实施例的远程会议的同声传译方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1示出了根据本申请一实施例的远程会议的同声传译方法的示意图。如图1所示,该方法包括:步骤S11,获取远程会议中的至少一个发言人的语音信息;步骤S12,根据语音信息以及参会人的接受语言,得到与语音信息对应的接受语言的同声传译字幕;步骤S13,根据发言人的数量,确定同声传译字幕的显示模式;步骤S14,根据显示模式,显示同声传译字幕。本申请实施例中,远程会议可以是多个终端设备间互传用户语音的音频会议,也可以是多个终端设备间互传用户语音及用户影像的视频会议。图2是可以实现本申请实施例的远程会议的同声传译方法的一个场景图,如图2所示,该方法可以在包括服务器200和终端设备的远程会议系统中实现,其中终端设备的数量为至少两个,图2中以四个终端设备210至240为示例。服务器200和终端设备210至240可以通过网络连接。各终端设备的用户是远程会议的参会人,当用户发言时,终端设备上的麦克风可以采集发言人的语音信息,将语音信息经由网络传送到远程会议系统中的其他终端设备,例如通过服务器发送至其他终端设备,使终端设备上能够播放发言人的语音信息。例如终端设备210采集到语音信息时,将语音信息上传到服务器200,则服务器200可以将语音信息发送到终端设备220至240,终端设备220至240播放该语音信息。服务器还可以根据语音信息和各参会人的接受语言,得到同声传译字幕,并根据发言人的数量确定显示模式,使各终端设备根据该显示模式显示同声传译字幕,或者将发言人的数量反馈至终端设备,使各终端设备根据发言人的数量确定显示模式并根据该显示模式显示同声传译字幕。例如,发言人在终端设备210上使用英语发言,识别终端设备210采集的语音信息,可以得到英语文本信息。如果使用终端设备220和230的参会人的接受语言是中文,使用终端设备240的参会人的接受语言是德语,则将英语文本信息翻译为中文文本信息和德语文本信息,作为同声传译字幕。在根据发言人的数量确定显示模式后,在终端设备220和230上根据该显示模式显示中文文本信息,在终端设备240上根据该显示模式显示德语文本信息。一般来说,会议中的沟通场景不同,发言人数也不同。例如在主讲人宣讲的沟通场景下,一般只有主讲人发言或者主讲人和主持人发言,发言人数量为1或2。而在讨论场景下,各个参会人都可以发言,发言人数量往往较多。本申请实施例根据发言人数,确定同声传译字幕的显示模式,基于该显示模式显示同声传译字幕,可以提示参会人当前的沟通场景,便于发言人快速适应不同的沟通场景,提高会议效率。示例性地,在显示同声传译字幕时,可以同时显示同声传译字幕对应的语音信息的发言人的标识例如头像、名称等,以便于用户分辨当前的发言人。在一种示例性的实施方式中,上述步骤S13,根据发言人的数量,确定同声传译字幕的显示模式,可以包括:响应于发言人的数量大于预设数量,确定同声传译字幕的显示模式为讨论模式。相应的,在上述步骤S14中,根据显示模式,显示同声传译字幕,可以包括:基于讨论模式,将同声传译字幕显示在语音信息对应的发言人的字幕显示区域。例如,预设数量为1,在发言人的数量大于1时,确定显示模式为讨论模式;或者,预设数量为2,在发言人的数量大于2时,确定显示模式为讨论模式。可选地,可以在终端设备上的会议页面显示同声传译字幕。会议页面包括参会人显示区域,可显示各参会人的视频画面或各参会人的标识例如头像、名称等。各参会人的字幕显示区域设置于与各参会人的视频画面或标识对应的位置。图3示出了会议页面的一本文档来自技高网...

【技术保护点】
1.一种远程会议的同声传译方法,包括:/n获取远程会议中的至少一个发言人的语音信息;/n根据所述语音信息以及参会人的接受语言,得到与所述语音信息对应的所述接受语言的同声传译字幕;/n根据所述发言人的数量,确定所述同声传译字幕的显示模式;/n根据所述显示模式,显示所述同声传译字幕。/n

【技术特征摘要】
1.一种远程会议的同声传译方法,包括:
获取远程会议中的至少一个发言人的语音信息;
根据所述语音信息以及参会人的接受语言,得到与所述语音信息对应的所述接受语言的同声传译字幕;
根据所述发言人的数量,确定所述同声传译字幕的显示模式;
根据所述显示模式,显示所述同声传译字幕。


2.根据权利要求1所述的方法,其中,所述根据所述发言人的数量,确定所述同声传译字幕的显示模式,包括:
响应于所述发言人的数量大于预设数量,确定所述同声传译字幕的显示模式为讨论模式;
相应的,所述根据所述发言人的数量,确定所述同声传译字幕的显示模式,包括:
基于所述讨论模式,将所述同声传译字幕显示在所述语音信息对应的发言人的字幕显示区域。


3.根据权利要求1所述的方法,其中,所述根据所述发言人的数量,确定所述同声传译字幕的显示模式,包括:
响应于所述发言人的数量小于等于预设数量,确定所述同声传译字幕的显示模式为主讲模式;
相应的,所述根据所述发言人的数量,确定所述同声传译字幕的显示模式,包括:
基于所述主讲模式,将所述同声传译字幕显示在会议页面的主显示区域。


4.根据权利要求3所述的方法,其中,所述响应于所述发言人的数量小于等于预设数量,确定所述同声传译字幕的显示模式为主讲模式,包括:
在所述发言人的数量小于等于预设数量且在第一预设时间段内获取到的语音信息的总时长大于预设阈值的情况下,确定所述同声传译字幕的显示模式为主讲模式。


5.根据权利要求1所述的方法,还包括:
根据参与所述远程会议的终端设备中开启麦克风的终端设备的数量,确定所述发言人的数量。


6.根据权利要求1所述的方法,还包括:
根据参与所述远程会议的终端设备中在第二预设时间段内获取到所述语音信息的终端设备的数量,确定所述发言人的数量。


7.根据权利要求1-6中任一项所述的方法,还包括:
根据所述参会人的终端设备的系统语言,确定所述参会人的接受语言。


8.一种远程会议的同声传译装置,包括:
语音获取模块,用于获取远程会议中的至少一个发言人的语音信息;
字幕获取模块,用于根据所述语音信息以及参会人的接受语言,得到与所述语音信息对应的...

【专利技术属性】
技术研发人员:崔双双辛永正苏文嗣
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1