语音翻译装置、语音翻译方法以及记录介质制造方法及图纸

技术编号:25839746 阅读:167 留言:0更新日期:2020-10-02 14:19
本发明专利技术提供语音翻译装置、语音翻译方法及记录介质。语音翻译装置(1)对第1说话者与第2说话者的会话进行翻译,第1说话者以第1语言说话,第2说话者以与第1语言不同的第2语言说话,具备:语音检测部(22),从输入到语音输入部(21)的声音中,检测第1及第2说话者发出的语音区间;显示部(27),通过由语音检测部检测到的语音区间的语音被语音识别,显示该语音所示的第1语言向第2语言的翻译结果,并且显示从第2语言向第1语言的翻译结果;说话指示部(25),在第1说话者说话后,将催促第2说话者说话的内容经由显示部以第2语言输出,并且在第2说话者说话后,将用于催促第1说话者说话的内容经由显示部以第1语言输出。

【技术实现步骤摘要】
语音翻译装置、语音翻译方法以及记录介质
本申请涉及语音翻译装置、语音翻译方法以及记录介质。
技术介绍
例如在专利文献1中公开了一种翻译系统,具备:语音输入部,将第1语言说话者以及第1语言说话者的会话对方即第2语言说话者发出的语音转换为语音数据并输出;输入开关,在第1语言说话者发出语音期间以及第1语言说话者没有发出语音期间都进行声音的输入;语音输出部,对被输入的语音数据进行翻译,将翻译结果转换为语音并输出。(现有技术文献)(专利文献)专利文献1专利第3891023号公报然而,在专利文献1公开的技术中,在第1说话者以及第2说话者进行会话的情况下,在第1说话者以及第2说话者分别说话时,每当说话时都需要操作输入开关,这样,操作变得繁琐。在第1说话者以及第2说话者进行会话时,由于每次都需要操作输入开关,从而翻译系统的使用频度以及使用期间都会增加。并且,在第1说话者以及第2说话者彼此对翻译系统进行操作的情况下,翻译系统的非持有者通常不能理解翻译系统的操作方法。因此,在进行翻译系统的操作时会花费功夫,这也将造成翻译系统的使用期间的增大。这样,在以往的翻译系统中存在因使用期间的增大而导致耗费能量的问题。
技术实现思路
因此,本申请的目的在于提供一种通过简单的操作,就能够抑制语音翻译装置的能量消耗的增大的语音翻译装置、语音翻译方法以及记录介质。本申请的一个形态所涉及的语音翻译装置,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话,所述语音翻译装置具备:语音检测部,从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间;显示部,通过由所述语音检测部检测的语音区间的语音被语音识别,从而所述显示部对该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且,对从所述第2语言翻译成所述第1语言的翻译结果进行显示;以及说话指示部,在所述第1说话者说话后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话后,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。并且,上述这些的一部分的具体的形态可以利用系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以通过对系统、方法、集成电路、计算机程序以及记录介质进行任意的组合来实现。专利技术效果通过本申请的语音翻译装置等,能够通过简单的操作,来抑制语音翻译装置的能量消耗的增大。附图说明图1A示出了实施方式1中的语音翻译装置的外观、以及第1说话者说话时的第1说话者和第2说话者的语音翻译装置的使用场面的一个例子。图1B示出了实施方式1中的语音翻译装置的外观、以及第2说话者说话时的第1说话者和第2说话者的语音翻译装置的使用场面的一个例子。图1C示出了第1说话者和第2说话者在进行会话时的语音翻译装置的使用场面的另外的一个例子。图2是示出实施方式1中的语音翻译装置的方框图。图3是示出实施方式1中的语音翻译装置的工作的流程图。图4是示出实施方式2中的语音翻译装置的方框图。图5是示出实施方式2中的语音翻译装置的工作的流程图。图6是示出实施方式2的变形例中的语音翻译装置的工作的流程图。图7是示出实施方式3中的语音翻译装置的方框图。图8是示出实施方式3中的语音翻译装置的工作的流程图。图9是示出实施方式3的变形例中的语音翻译装置的方框图。图10是示出实施方式4中的语音翻译装置的方框图。图11是示出实施方式4中的语音翻译装置的工作的流程图。符号说明1、1a、1b、1c、1d语音翻译装置21语音输入部22语音检测部23语音识别部24优先说话输入部25说话指示部26翻译部27显示部28语音输出部31声源方向估计部31a控制部32输入切换部41第1波束成形部42第2波束成形部具体实施方式本申请的一个形态所涉及的语音翻译装置,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话,所述语音翻译装置具备:语音检测部,从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间;显示部,通过由所述语音检测部检测的语音区间的语音被语音识别,从而所述显示部对该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且,对从所述第2语言翻译成所述第1语言的翻译结果进行显示;以及说话指示部,在所述第1说话者说话后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话后,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。据此,通过从第1说话者与第2说话者的会话中来检测各自的语音区间,从而能够获得将检测到的语音从第1语言翻译为第2语言的翻译结果,并能够获得将检测到的语音从第2语言翻译到所述第1语言的翻译结果。即,在该语音翻译装置中不需要进行用于翻译的输入操作,就能够按照第1说话者和第2说话者的各自的说话,自动地将检测到的语音的语言翻译为其他的语言。并且,语音翻译装置能够在第1说话者说话后,输出用于催促第2说话者说话的内容,在第2说话者说话后,输出用于催促第1说话者说话的内容。据此,在该语音翻译装置,每当第1说话者和第2说话者各自说话时,无需进行开始说话的输入操作,就能够识别第1说话者与第2说话者说话的时机。如以上所述,在语音翻译装置,由于无需进行用于开始说话的输入操作、以及用于对语言进行切换的输入操作等,因此具有优越的操作性。即,该语音翻译装置的操作不繁琐,因此能够抑制使用期间的增大。因此,在语音翻译装置中,通过将操作变得简单,从而能够抑制语音翻译装置的能量消耗的增大。尤其是在该语音翻译装置中,由于能够使操作变得简单,因此能够抑制误操作。本申请的其他的形态所涉及的语音翻译方法,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话,在所述语音翻译方法中包括:从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间,通过对检测出的语音区间的语音进行语音识别,从而显示部对从该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且对从所述第2语言翻译成所述第1语言的翻译结果进行显示,在所述第1说话者说话之后,将用于催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话之后,将用于催促所述第1说话者说话的内容,经由所本文档来自技高网...

【技术保护点】
1.一种语音翻译装置,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话,/n所述语音翻译装置具备:/n语音检测部,从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间;/n显示部,通过由所述语音检测部检测的语音区间的语音被语音识别,从而所述显示部对该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且,对从所述第2语言翻译成所述第1语言的翻译结果进行显示;以及/n说话指示部,在所述第1说话者说话后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话后,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。/n

【技术特征摘要】
20191029 JP 2019-196078;20190325 US 62/8231971.一种语音翻译装置,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话,
所述语音翻译装置具备:
语音检测部,从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间;
显示部,通过由所述语音检测部检测的语音区间的语音被语音识别,从而所述显示部对该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且,对从所述第2语言翻译成所述第1语言的翻译结果进行显示;以及
说话指示部,在所述第1说话者说话后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话后,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。


2.如权利要求1所述的语音翻译装置,
所述语音翻译装置进一步具备优先说话输入部,所述优先说话输入部在所述第1说话者或所述第2说话者发出的语音被语音识别的情况下,使进行了该语音识别的所述第1说话者或所述第2说话者发出的语音优先被再次进行语音识别。


3.如权利要求1或2所述的语音翻译装置,
所述语音翻译装置进一步具备:
语音输入部,被输入所述第1说话者与所述第2说话者进行会话的语音;
语音识别部,通过对由所述语音检测部检测到的语音区间的语音进行语音识别,从而转换为文本文件;
翻译部,将由所述语音识别部转换的所述文本文件从所述第1语言翻译成所述第2语言,并且从所述第2语言翻译成所述第1语言;以及
语音输出部,将由所述翻译部翻译的结果,通过语音来输出。


4.如权利要求3所述的语音翻译装置,
所述语音输入部被设置多个,
所述语音翻译装置进一步具备:
第1波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第1说话者的语音的声源方向;
第2波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第2说话者的语音的声源方向;
输入切换部,将获得的信号切换成所述第1波束成形部的输出信号、或所述第2波束成形部的输出信号;以及
声源方向估计部,通过对被输入到多个所述语音输入部的语音进行信号处理,从而对声源方向进行估计,
所述说话指示部,使所述输入切换部进行或者获得所述第1波束成形部的输出信号、或者获得所述第2波束成形部的输出信号的切换。


5.如权利要求3所述的语音翻译装置,
所述语音输入部被设置多个,
所述语音翻译装置进一步具备:
声源方向估计部,通过对被输入到多个所述语音输入部的语音进行信号处理,来估计声源方向;以及
控制部,使所述第1语言显示在,与相对于该语音翻译装置的所述第1说话者的位置对应的所述显示部的显示区域,使所述第2语言显示在,与相对于该语音翻译装置的所述第2说话者的位置对应的所述显示部的显示区域,
所述控制部,
对显示方向与由所述声源方向估计部估计的声源方向进行比较,该显示方向是从该语音翻译装置的显示部朝向所述第1说话者或所述第2说话者的方向,并且是在所...

【专利技术属性】
技术研发人员:古川博基坂口敦西川刚树
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1