语音识别装置、语音识别方法及记录介质制造方法及图纸

技术编号：25892364 阅读：178 留言：0更新日期：2020-10-09 23:36

一种语音识别装置、语音识别方法及记录介质。语音识别装置具备：取得部，取得第1说话者及1个以上的第2说话者的会话的各个语音；存储部，存储第1说话者及1个以上的第2说话者的会话的各个语音；输入部，受理操作输入；发言开始检测部，与向输入部的操作输入相应地按每个语音检测开始发言的开始位置；发言者区别部，基于按每个语音设定的、受理了向输入部的操作输入的第1时刻以及表示发言开始检测部根据各个语音检测出的发言的开始位置的第2时刻，区别是进行了操作输入的第1说话者还是未进行操作输入的1个以上的第2说话者。然后，被进行了区别的处理的第1说话者及1个以上的第2说话者的各个语音供语音识别部语音识别。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别装置、语音识别方法及记录介质
本公开涉及语音识别装置、语音识别方法及记录介质。
技术介绍
例如在专利文献1中公开了一种语音识别装置，具备：发言定时指示取得机构，取得用户对发言定时的指示；语音信号保持机构，对输入的语音信号进行保持，在由发言定时指示取得机构取得了发言开始的指示的情况下，输出所保持的语音信号及其后输入的语音信号；发言区间检测机构，根据由语音信号保持机构输出的语音信号检测发言区间；以及误操作检测机构，对发言区间的时刻信息与发言定时的指示的有无及时刻信息进行比较，作为用户的误操作进行检测。在该语音识别装置中，通过对用户的误操作进行检测，能够将检测出的误操作向用户通知。在先技术文献专利文献专利文献1：日本特许第5375423号公报
技术实现思路
专利技术所要解决的课题但是，在专利文献1公开的技术中，例如在第1说话者是语音识别装置的拥有者的情况下，第1说话者由于理解了自身拥有的语音识别装置的使用方法，能够进行正确的操作以使语音识别装置对自身的发言进行识别。因此，第1说话者从自身所发言的语音的开始到结束，都能够使语音识别装置识别。但是，第1说话者的会话对象的第2说话者不知道语音识别装置的使用方法，第1说话者无法认识到第2说话者所发言的定时。因此，第1说话者难以从第2说话者所发言的语音的开始到结束都使语音识别装置识别。由此，无法充分地对第2说话者所发言的语音进行语音识别，因此第1说话者需要再次促使第2说话者发言。于是，本公开鉴于上述的缘由而做...

【技术保护点】
1.一种语音识别装置，是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置，具备：/n取得部，取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音；/n存储部，存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音；/n输入部，至少受理来自所述第1说话者的操作输入；/n发言开始检测部，与向所述输入部的操作输入相应地，根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置；以及/n发言者区别部，基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻，从所述第1说话者及所述1个以上的第2说话者之中，区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者；/n由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音，供语音识别部进行语音识别。/n

【技术特征摘要】
20191030 JP 2019-197289;20190327 US 62/8246411.一种语音识别装置，是供第1说话者与作为所述第1说话者的会话对象的1个以上的第2说话者进行会话的语音识别装置，具备：
取得部，取得所述第1说话者及所述1个以上的第2说话者的会话的各个语音；
存储部，存储所述取得部所取得的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音；
输入部，至少受理来自所述第1说话者的操作输入；
发言开始检测部，与向所述输入部的操作输入相应地，根据所述存储部中存储的所述各个语音按每个语音检测开始发言的开始位置；以及
发言者区别部，基于按每个语音设定的、受理了向所述输入部的操作输入的第1时刻以及表示所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻，从所述第1说话者及所述1个以上的第2说话者之中，区别是向所述输入部进行了操作输入的所述第1说话者还是未向所述输入部进行操作输入的所述1个以上的第2说话者；
由所述发言者区别部进行了所述区别的处理的所述第1说话者及所述1个以上的第2说话者的所述各个语音中的开始位置以后的语音，供语音识别部进行语音识别。

2.如权利要求1所述的语音识别装置，
所述发言者区别部为：
对按所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音设定的所述第1时刻与所述第2时刻进行比较，
在所述第1时刻是与所述第2时刻相比时间更早的时刻的情况下，从所述第1说话者及所述1个以上的第2说话者之中区别所述第1说话者，
在所述第2时刻是与所述第1时刻相比时间更早的时刻的情况下，从所述第1说话者及所述1个以上的第2说话者之中区别所述1个以上的第2说话者。

3.如权利要求1或者2所述的语音识别装置，
在从所述第1说话者及所述1个以上的第2说话者之中区别了所述第1说话者的情况下，所述语音识别部对所述第1说话者所发言的语音进行语音识别，
在从所述第1说话者及所述1个以上的第2说话者之中区别了第2说话者的情况下，所述语音识别部对所述第2说话者所发言的语音进行语音识别。

4.如权利要求1或者2所述的语音识别装置，
所述发言者区别部根据规定期间中的所述第1说话者及所述1个以上的第2说话者的会话的所述各个语音，区别是所述第1说话者还是所述1个以上的第2说话者，所述规定期间是所...

【专利技术属性】
技术研发人员：西川刚树，古川博基，坂口敦，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人