说话者预测方法、说话者预测装置以及通信系统制造方法及图纸

技术编号:33210629 阅读:24 留言:0更新日期:2022-04-27 16:45
本发明专利技术提供了一种说话者预测方法、说话者预测装置以及通信系统。能够在当前的说话者正在说话的期间高精度地预测下一个要说话的说话者。说话者预测方法是用于获取多个说话者的语音并记录所述多个说话者的会话历史的说话者预测方法,该说话者预测方法获取语音,确定所获取的所述语音的说话者,基于所述确定的所述说话者和所述会话历史,从所述多个说话者中预测下一个要发声的说话者。预测下一个要发声的说话者。预测下一个要发声的说话者。

【技术实现步骤摘要】
说话者预测方法、说话者预测装置以及通信系统


[0001]本专利技术的一个实施方式涉及用于预测说话者的说话者预测方法、说话者预测装置以及通信系统。

技术介绍

[0002]在专利文献1中,公开了从多个人物中预测下一个说话的说话者的预测装置。
[0003]现有技术文献
[0004]专利文献
[0005]专利文献1:日本特开2012

29209号公报

技术实现思路

[0006]专利技术要解决的课题
[0007]期望在当前的说话者正在说话的期间,以更高的精度预测下一个要说话的说话者。
[0008]因此,本专利技术的一个实施方式的目的在于,提供一种说话者预测方法、说话者预测装置以及通信系统,其能够在当前的说话者正在说话的期间高精度地预测下一个要说话的说话者。
[0009]用于解决课题的手段
[0010]说话者预测方法是获取多个说话者的语音并记录所述多个说话者的会话历史的说话者预测方法,该说话者预测方法获取语音,确定所获取的所述语音的说话者,根据确定的所述说话者和所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种说话者预测方法,是获取多个说话者的语音并记录多个所述说话者的会话历史的说话者预测方法,其中,获取语音,确定所获取的所述语音的说话者,基于确定出的所述说话者和所述会话历史,从多个所述说话者中预测下一个要发声的说话者。2.根据权利要求1所述的说话者预测方法,其中,基于所述预测的结果,进行相机所拍摄的图像的控制。3.根据权利要求1或2所述的说话者预测方法,其中,基于所述预测的结果,进行由麦克风获取到的声音信号的声音信号处理。4.根据权利要求2所述的说话者预测方法,其中,所述图像的控制包括成帧处理。5.根据权利要求3所述的说话者预测方法,其中,所述声音信号处理包括波束成形处理。6.根据权利要求1至5中任一项所述的说话者预测方法,其中,基于所述获取到的所述语音的语音特征量,确定所获取到的所述语音的说话者。7.根据权利要求1至6中任一项所述的说话者预测方法,其中,估计语音的到来方向,基于所述语音的到来方向,确定所获取到的所述语音的说话者。8.根据权利要求1至7中任一项所述的说话者预测方法,其中,获取相机的图像,基于所述相机的图像,确定所获取到的所述语音的说话者。9.根据权利要求1至8中任一项所述的说话者预测方法,其中,根据所述会话历史检测所确定出的所述说话者进行了发声的部位,根据检测出的所述部位的下一个发声的说话者的发声概率,预测所述下一个要发声的说话者。10.根据权利要求1至9中任一项所述的说话者预测方法,其中,所述会话历史包括远端侧以及近端侧的说话者的会话历史,至少确定远端侧的说话者的语音,来预测下一个要发声的近端侧的说话者。11.一种说话者预测装置,包括:语音获取部,用于获取多个说话者的语音;以及会话历史记录部,记录多个所述说话者的会话历史,其中,所述语音获取部获取语音,所述说话者预测装置还包括:说话者确定部,确定所获取到的所述语音的说话者;以及预测部,基于确定出的所述说话者和所述会话历史,从多个所述说话者中预测下一个要发声的说话者。12.根据权利要求11所述的说话者预测装置,其中,所述说话者预测装置包括相机图像控制部,该相机图...

【专利技术属性】
技术研发人员:鹈饲训史田中良
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1