语音识别装置、语音识别方法及记录介质制造方法及图纸

技术编号:25892364 阅读:178 留言:0更新日期:2020-10-09 23:36
一种语音识别装置、语音识别方法及记录介质。语音识别装置具备:取得部,取得第1说话者及1个以上的第2说话者的会话的各个语音;存储部,存储第1说话者及1个以上的第2说话者的会话的各个语音;输入部,受理操作输入;发言开始检测部,与向输入部的操作输入相应地按每个语音检测开始发言的开始位置;发言者区别部,基于按每个语音设定的、受理了向输入部的操作输入的第1时刻以及表示发言开始检测部根据各个语音检测出的发言的开始位置的第2时刻,区别是进行了操作输入的第1说话者还是未进行操作输入的1个以上的第2说话者。然后,被进行了区别的处理的第1说话者及1个以上的第2说话者的各个语音供语音识别部语音识别。

【技术实现步骤摘要】
语音识别装置、语音识别方法及记录介质
本公开涉及语音识别装置、语音识别方法及记录介质。
技术介绍
例如在专利文献1中公开了一种语音识别装置,具备:发言定时指示取得机构,取得用户对发言定时的指示;语音信号保持机构,对输入的语音信号进行保持,在由发言定时指示取得机构取得了发言开始的指示的情况下,输出所保持的语音信号及其后输入的语音信号;发言区间检测机构,根据由语音信号保持机构输出的语音信号检测发言区间;以及误操作检测机构,对发言区间的时刻信息与发言定时的指示的有无及时刻信息进行比较,作为用户的误操作进行检测。在该语音识别装置中,通过对用户的误操作进行检测,能够将检测出的误操作向用户通知。在先技术文献专利文献专利文献1:日本特许第5375423号公报
技术实现思路
专利技术所要解决的课题但是,在专利文献1公开的技术中,例如在第1说话者是语音识别装置的拥有者的情况下,第1说话者由于理解了自身拥有的语音识别装置的使用方法,能够进行正确的操作以使语音识别装置对自身的发言进行识别。因此,第1说话者从自身所发言的语音的开始到结束,都能够使语音识别装置识别。但是,第1说话者的会话对象的第2说话者不知道语音识别装置的使用方法,第1说话者无法认识到第2说话者所发言的定时。因此,第1说话者难以从第2说话者所发言的语音的开始到结束都使语音识别装置识别。由此,无法充分地对第2说话者所发言的语音进行语音识别,因此第1说话者需要再次促使第2说话者发言。于是,本公开鉴于上述的缘由而做出,其目的在于,提供能够通过切实地取得会话对象的语音从而对会话对象的语音进行语音识别的语音识别装置、语音识别方法及记录介质。用于解决课题的手段本公开的一个方式所涉及的语音识别装置是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置,具备:取得部,取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音;存储部,存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音;输入部,至少受理来自所述第1说话者的操作输入;发言开始检测部,与向所述输入部的操作输入相应地,根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置;发言者区别部,基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述第1说话者及所述1个以上的第2说话者之中,区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者,由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音供语音识别部进行语音识别。此外,这些之中的一部分的具体的方式也可以使用系统、方法、集成电路、计算机程序或者计算机可读取的CD-ROM等记录介质实现,也可以使用系统、方法、集成电路、计算机程序及记录介质的任意组合实现。专利技术效果根据本公开的语音识别装置等,能够通过切实地取得会话对象的语音,对会话对象的语音进行语音识别。附图说明图1A是表示搭载了实施方式1中的语音识别装置的语音翻译装置的外观、以及第1说话者和第2说话者的语音翻译装置的使用场面的一例的图。图1B是表示实施方式1中的其他的语音翻译装置的外观的一例的图。图2是表示实施方式1中的语音翻译装置的框图。图3是表示第1说话者发言的情况下的语音翻译装置的动作的流程图。图4是对第1说话者与第2说话者会话时的第1时刻和第2时刻的时序进行例示的图。图5是表示第2说话者发言的情况下的语音翻译装置的动作的流程图。图6是表示实施方式1中的语音翻译装置的发言者区别部中的动作的流程图。图7是表示实施方式2中的语音翻译装置的框图。附图标记说明:10、10a语音识别装置21取得部22存储部23发言开始检测部24输入部25发言者区别部26、51语音识别部29通信部。具体实施方式本公开的一个方式所涉及的语音识别装置是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置,具备:取得部,取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音,存储部,存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音;输入部,至少受理来自所述第1说话者的操作输入;发言开始检测部,与向所述输入部的操作输入相应地,根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置;发言者区别部,基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述第1说话者及所述1个以上的第2说话者之中,区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者;由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音供语音识别部进行语音识别。于是,根据本公开,第1说话者及1个以上的第2说话者的会话的各个语音被存储于存储部,因此能够根据存储的语音区别是第1说话者还是第2说话者。由此,语音识别部能够从存储部读出被进行了区别的处理的第1说话者及第2说话者的各个语音并进行语音识别。也就是说,如果在第1说话者向输入部进行了操作输入后第1说话者发言,则语音识别部能够对第1说话者所发言的语音进行语音识别。另外,通常在第1说话者的发言结束后第2说话者开始发言,因此通过与第2说话者的发言相应地由说话者向输入部进行操作输入,语音识别部能够对第2说话者所发言的语音进行语音识别。因此,在该语音识别装置中,能够通过切实地取得会话对象的语音,从而对会话对象的语音进行语音识别。另外,本公开的其他方式所涉及的语音识别方法是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别方法,包含:取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音;将取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音存储至存储部;至少受理从所述第1说话者向输入部的操作输入;与向所述输入部的操作输入相应地,根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置;基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示根据所述各个语音检测出的发言的开始位置的第2时刻,从所述第1说话者及所述1个以上的第2说话者之中,区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者;以及被进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音用于语音识别。在该语音本文档来自技高网...

【技术保护点】
1.一种语音识别装置,是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置,具备:/n取得部,取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音;/n存储部,存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音;/n输入部,至少受理来自所述第1说话者的操作输入;/n发言开始检测部,与向所述输入部的操作输入相应地,根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置;以及/n发言者区别部,基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述第1说话者及所述1个以上的第2说话者之中,区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者;/n由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音,供语音识别部进行语音识别。/n

【技术特征摘要】
20191030 JP 2019-197289;20190327 US 62/8246411.一种语音识别装置,是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置,具备:
取得部,取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音;
存储部,存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音;
输入部,至少受理来自所述第1说话者的操作输入;
发言开始检测部,与向所述输入部的操作输入相应地,根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置;以及
发言者区别部,基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述第1说话者及所述1个以上的第2说话者之中,区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者;
由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音,供语音识别部进行语音识别。


2.如权利要求1所述的语音识别装置,
所述发言者区别部为:
对按所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音设定的所述第1时刻与所述第2时刻进行比较,
在所述第1时刻是与所述第2时刻相比时间更早的时刻的情况下,从所述第1说话者及所述1个以上的第2说话者之中区别所述第1说话者,
在所述第2时刻是与所述第1时刻相比时间更早的时刻的情况下,从所述第1说话者及所述1个以上的第2说话者之中区别所述1个以上的第2说话者。


3.如权利要求1或者2所述的语音识别装置,
在从所述第1说话者及所述1个以上的第2说话者之中区别了所述第1说话者的情况下,所述语音识别部对所述第1说话者所发言的语音进行语音识别,
在从所述第1说话者及所述1个以上的第2说话者之中区别了第2说话者的情况下,所述语音识别部对所述第2说话者所发言的语音进行语音识别。


4.如权利要求1或者2所述的语音识别装置,
所述发言者区别部根据规定期间中的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音,区别是所述第1说话者还是所述1个以上的第2说话者,所述规定期间是所...

【专利技术属性】
技术研发人员:西川刚树古川博基坂口敦
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1