语音翻译装置、语音翻译方法及其存储介质制造方法及图纸

技术编号:22296952 阅读:381 留言:0更新日期:2019-10-15 05:51
语音翻译装置具有:音源方向推定部,根据由麦克风阵列部取得的音响信号,推定音源方向;以及控制部,使用由存储于存储部的预先选择的一布局信息示出的位置关系,在由翻译开始按键指示了翻译开始后基于推定出的音源方向,确定发言者是使用者及对话对手的中的一者,且决定示出识别音响信号的内容的一个语言和翻译音响信号的内容的另一个语言的翻译方向,按照决定的翻译方向,取得以一个语言对音响信号进行识别所得的文本文,及以另一个语言对该文本文进行翻译所得的翻译文本文,控制部,在与一者的位置对应的显示器的区域显示文本文,在与另一者的位置对应的显示器的区域显示翻译文本文。

Speech Translation Device, Speech Translation Method and Storage Media

【技术实现步骤摘要】
语音翻译装置、语音翻译方法及其存储介质
本公开涉及语音翻译装置、语音翻译方法及其存储介质。
技术介绍
例如在专利文献1中公开了下述技术,即,在使用者与其对话对手的2个语言间,对使用者与其对话对手的发言内容的各自的语言进行识别,将发言内容翻译为彼此的对手的语言。现有技术文献专利文献专利文献1:日本专利第3891023号公报
技术实现思路
专利技术要解决的课题但是,在专利文献1中公开的技术中存在下述课题,即,使用者与其对话对手各自需要每次进行按键操作然后发言,操作繁杂。本公开就是鉴于上述的情况而提出的,目的在于提供能够提高操控性的语音翻译装置、语音翻译方法及其存储介质。用于解决课题的手段本公开的一个方式涉及的语音翻译装置是语音翻译装置,具有:翻译开始按键,通过被所述语音翻译装置的使用者或所述使用者的对话对手操作从而指示翻译开始;音源方向推定部,通过对由麦克风阵列部取得的音响信号进行信号处理,从而推定音源方向;控制部,使用由多个布局信息中的预先选择的一布局信息示出的位置关系,在由所述翻译开始按键指示了翻译开始后,基于由所述音源方向推定部推定出的音源方向,确定发出语音的发言者是所述使用者及所述对话对手中的一者,且决定翻译方向,所述多个布局信息示出所述使用者、所述对话对手、及显示器的不同的位置关系,存储于存储部,所述翻译方向示出第1语言和与所述第1语言不同的第2语言中的识别所述音响信号的内容的一个语言和翻译所述音响信号的内容的另一个语言;翻译部,按照由所述控制部决定的所述翻译方向,取得使识别处理部以所述一个语言对所述音响信号进行识别所得的表示所述音响信号的内容的文本文,及使翻译处理部以另一个语言对该文本文进行翻译所得的表示所述音响信号的内容的翻译文本文;以及显示部,在所述显示器的与确定出的所述一者的位置对应的区域显示所述文本文,在所述显示器的与不同于所述一者的另一者的位置对应的区域显示所述翻译文本文。此外,这些方式中的一部分具体的方式可以使用系统、方法、集成电路、计算机程序或能够由计算机读取的CD-ROM等存储介质实现,也可以使用系统、方法、集成电路、计算机程序及存储介质的任意的组合实现。专利技术的效果根据本公开,能够实现能够提高操控性的语音翻译装置等。附图说明图1是表示实施方式1中的语音翻译装置的外观和使用场景的一个例子的图。图2是表示实施方式1中的语音翻译装置的结构的一个例子的图。图3A是表示构成实施方式1中的麦克风阵列部的麦克风阵列的实际安装例的说明图。图3B是表示构成实施方式1中的麦克风阵列部的麦克风阵列的实际安装例的说明图。图3C是表示构成实施方式1中的麦克风阵列部的麦克风阵列的实际安装例的说明图。图4A是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图4B是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图4C是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图4D是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图4E是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图5是表示存储于实施方式1中的存储部的坐标系和分割区域和分别分配给分割区域的索引的一个例子的图。图6A是表示在纵向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图6B是表示在纵向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图6C是表示在纵向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图6D是表示在纵向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图6E是表示在纵向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图7A是表示在纵向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图7B是表示在纵向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图7C是表示在纵向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图7D是表示在纵向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图8A是表示显示于实施方式1中的显示器的显示画面的一个例子的图。图8B是表示显示于实施方式1中的显示器的显示画面的一个例子的图。图9是表示实施方式1中的语音翻译装置进行的动作处理的流程图。图10A是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图10B是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图10C是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图10D是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图10E是表示存储于实施方式1中的存储部的布局信息的一个例子的图。图11A是表示在横向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图11B是表示在横向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图11C是表示在横向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图11D是表示在横向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图11E是表示在横向地使用实施方式1中的语音翻译装置的情况下使用者及对话对手所在的分割区域的索引的图。图12A是表示在横向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图12B是表示在横向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图12C是表示在横向地使用实施方式1中的语音翻译装置的情况下显示于显示器的显示画面的一个例子的图。图13是表示实施方式1的变形例1中的语音翻译装置的结构的一个例子的图。图14是表示实施方式1的变形例2中的语音翻译装置的结构的一个例子的图。图15是表示实施方式1的实施例中的语音翻译装置的结构的一个例子的图。图16是表示实施方式1的实施例中的语音翻译装置进行的动作处理的流程图。图17是表示实施方式2中的语音翻译装置的结构的一个例子的图。图18是表示实施方式2中的语音翻译装置进行的动作处理的流程图。具体实施方式本公开的一个方式涉及的语音翻译装置是语音翻译装置,具有:翻译开始按键,通过被所述语音翻译装置的使用者或所述使用者的对话对手操作从而指示翻译开始;音源方向推定部,通过对由麦克风阵列部取得的音响信号进行信号处理,从而推定音源方向;控制部,使用由多个布局信息中的预先选择的一布局信息示出的位置关系,在由所述翻译开始按键指示了翻译开始后,基于由所述音源方向推定部推定出的音源方向,确定发出语音的发言者是所述使用者及所述对话对手中的一者,且决定翻译方向,所述多个布局信息示出所述使用者、所述对话对手、及显示器的不同的位置关系,存储于存储部,所述翻译方向示出第1语言和与所述第1语言不同的第2语言中的识别所述音响信号的内容的一个语言和翻译所述音响信号的内容的另一个语言;翻译部,按照由所述控制部决定的所述翻译方向,取得使识别处理部以所述一个语言对所述音本文档来自技高网...

【技术保护点】
1.一种语音翻译装置,具有:翻译开始按键,通过被所述语音翻译装置的使用者或所述使用者的对话对手操作从而指示翻译开始;音源方向推定部,通过对由麦克风阵列部取得的音响信号进行信号处理,从而推定音源方向;控制部,使用由多个布局信息中的预先选择的一布局信息示出的位置关系,在由所述翻译开始按键指示了翻译开始后,基于由所述音源方向推定部推定出的音源方向,确定发出语音的发言者是所述使用者及所述对话对手中的一者,且决定翻译方向,所述多个布局信息示出所述使用者、所述对话对手、及显示器的不同的位置关系,且存储于存储部,所述翻译方向示出第1语言和与所述第1语言不同的第2语言中的识别所述音响信号的内容的一个语言和翻译所述音响信号的内容的另一个语言;翻译部,按照由所述控制部决定的所述翻译方向,取得使识别处理部以所述一个语言对所述音响信号进行识别所得的表示所述音响信号的内容的文本文,及使翻译处理部以另一个语言对该文本文进行翻译所得的表示所述音响信号的内容的翻译文本文;以及显示部,在所述显示器的与确定出的所述一者的位置对应的区域显示所述文本文,在所述显示器的与不同于所述一者的另一者的位置对应的区域显示所述翻译文本文...

【技术特征摘要】
2018.12.07 JP 2018-230066;2018.03.29 US 62/6499041.一种语音翻译装置,具有:翻译开始按键,通过被所述语音翻译装置的使用者或所述使用者的对话对手操作从而指示翻译开始;音源方向推定部,通过对由麦克风阵列部取得的音响信号进行信号处理,从而推定音源方向;控制部,使用由多个布局信息中的预先选择的一布局信息示出的位置关系,在由所述翻译开始按键指示了翻译开始后,基于由所述音源方向推定部推定出的音源方向,确定发出语音的发言者是所述使用者及所述对话对手中的一者,且决定翻译方向,所述多个布局信息示出所述使用者、所述对话对手、及显示器的不同的位置关系,且存储于存储部,所述翻译方向示出第1语言和与所述第1语言不同的第2语言中的识别所述音响信号的内容的一个语言和翻译所述音响信号的内容的另一个语言;翻译部,按照由所述控制部决定的所述翻译方向,取得使识别处理部以所述一个语言对所述音响信号进行识别所得的表示所述音响信号的内容的文本文,及使翻译处理部以另一个语言对该文本文进行翻译所得的表示所述音响信号的内容的翻译文本文;以及显示部,在所述显示器的与确定出的所述一者的位置对应的区域显示所述文本文,在所述显示器的与不同于所述一者的另一者的位置对应的区域显示所述翻译文本文。2.如权利要求1所述的语音翻译装置,其中,所述翻译部具有所述识别处理部和所述翻译处理部。3.如权利要求1所述的语音翻译装置,其中,所述翻译部能够经由网络与服务器连接,所述服务器具有所述识别处理部和所述翻译处理部的至少一个。4.如权利要求1所述的语音翻译装置,进一步具有:延迟部,使由所述麦克风阵列部取得的所述音响信号延迟一定时间;以及波束形成部,通过对已被所述延迟部延迟的所述音响信号进行信号处理,从而形成作为将收音的指向性控制为规定方向的音响信号的波束,所述波束形成部作为所述规定方向,在由所述音源方向推定部推定出的所述音源方向形成波束。5.如权利要求1~4中任一项所述的语音翻译装置,其中,进一步具有扬声器,所述翻译部进一步取得使文本合成处理部将所述翻译文本文转换为所述另一个语言的语音数据所得的翻译语音数据,传达给所述扬声器,所述扬声器按照传达到的所述翻译语音数据,对所述翻译文本文的语音进行发音。6.如权利要求1~4中任一项所述的语音翻译装置,其中,所述显示器的形状是卡片状,所述显示部在所述一布局信息示出所述使用者和所述对话对手隔着所述显示器面对面的位置关系的情况下,以所述文本文与所述翻译文本文文字的朝向相反的方式,在所述显示器的对应的区域中显示所述文本文和所述翻译文本文。7.如权利要求1~4中任一项所述的语音翻译装置,其中,所述显示器的形状是卡片状,所述显示部在所述一布局信息示出下述位置关系的情况下,以按直角旋转所述文本文和所述翻译文本文的文字的朝向所得的朝向,在所述显示器的对应的区域中显示所述文本文和所述翻译文本文,该位置关系是指将所述显示器作为中心,所述使用者位于面对所述显示器的第1边的位置,所述对话对手位于面对方向与所述第1边垂直的与所述第1边不同的第2边的位置。8.如权利要求1~4中任一项所述的语音翻译装置,其中,所述显示器的形状是卡片状,所述多个布局信息包含下述位置关系:所述使用者和所述对话对手隔着所述显示器面对面;相对于所述显示器的1条边,所述使用者及所述对话对手以所述使用者、所述对话对手的顺序或相反的顺序横向排列;及将所述显示器作为中心,所述使用者位于面对所述显示器的第1边的位置,所述对话对手位于面对方向与所述第1边垂直的与所述第1边不同的第2边的位置。9.如权利要求1~4中任一项所述的语音翻译装置,其中,进一步具有语音判定部,对由所述麦克风阵列部取得的所述音响信号是否包含语音进行判定,...

【专利技术属性】
技术研发人员:古川博基西川刚树坂口敦林田亘平
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1