【技术实现步骤摘要】
一种提高声源拾音准确度的多喇叭播放方法、装置、系统及存储介质
本专利技术涉及数据处理领域,尤其涉及一种提高声源拾音准确度的多喇叭播放方法、装置、系统及存储介质。
技术介绍
目前涉及人机语音交互有智能机器人、智能音箱等产品,现有技术的语音交互方案着重放在人机交互娱乐、设备拾音等场景优化,未考虑到少数耳背群体的交互体验。
技术实现思路
本专利技术提供了一种提高声源拾音准确度的多喇叭播放方法,包括执行以下步骤:步骤S1:基准输出开始;步骤S2:声纹识别发出语音者是否为机主;如果是,执行步骤S3,否则,执行步骤S6;步骤S3:多麦阵列识别声源的方位是否发生改变,如果是,则执行步骤S4,否则执行步骤S5;步骤S4:云台接收到方向指令后自动转向机主声源方向,同时云台判断是否获取到机主的反面基准指令,如果是,则将正面基准的M、N值进行互换,执行反面基准后再返回执行步骤S3,如果否,则执行步骤S5;步骤S5:执行正面基准,提升机主的拾音准确度;步骤S6:基准输出结束 ...
【技术保护点】
1.一种提高声源拾音准确度的多喇叭播放方法,其特征在于,包括执行以下步骤:/n步骤S1:基准输出开始;/n步骤S2:声纹识别发出语音者是否为机主;如果是,执行步骤S3,否则,执行步骤S6;/n步骤S3:多麦阵列识别声源的方位是否发生改变,如果是,则执行步骤S4,否则执行步骤S5;/n步骤S4:云台接收到方向指令后自动转向机主声源方向,同时云台判断是否获取到机主的反面基准指令,如果是,则将正面基准的M、N值进行互换,执行反面基准后再返回执行步骤S3,如果否,则执行步骤S5;/n步骤S5:执行正面基准,提升机主的拾音准确度;/n步骤S6:基准输出结束。/n
【技术特征摘要】
1.一种提高声源拾音准确度的多喇叭播放方法,其特征在于,包括执行以下步骤:
步骤S1:基准输出开始;
步骤S2:声纹识别发出语音者是否为机主;如果是,执行步骤S3,否则,执行步骤S6;
步骤S3:多麦阵列识别声源的方位是否发生改变,如果是,则执行步骤S4,否则执行步骤S5;
步骤S4:云台接收到方向指令后自动转向机主声源方向,同时云台判断是否获取到机主的反面基准指令,如果是,则将正面基准的M、N值进行互换,执行反面基准后再返回执行步骤S3,如果否,则执行步骤S5;
步骤S5:执行正面基准,提升机主的拾音准确度;
步骤S6:基准输出结束。
2.根据权利要求1所述的多喇叭播放方法,其特征在于,在所述步骤S5中,还包括执行以下步骤:
步骤1:设备输出默认确认语音V1;V1:请确认音量是否清晰;
步骤2:机主是否回应;如果回应,则执行步骤3,否则执行C方案;
步骤3:切换输出语音V2;V2:请确认左、右哪边不清晰;
步骤4:判断回应内容中是否包含不清晰关键词,如果包含,则执行步骤5,否则执行是否为机主的首次回应判断,如果是机主的首次回应,则将机主定义为正常听力的使用者,否则,执行步骤5;
步骤5:判断回应内容中是否包含左or右关键词,如果包含左关键词,则执行A方案,如果包含右关键词,则执行B方案,否则执行步骤6;
步骤6:锁定M、N、O音量设定作为正面基准参数;
步骤7:利用声纹识别技术将正面基准锁定仅适用于机主;
步骤8:正面基准获取成功。
3.根据权利要求2所述的多喇叭播放方法,其特征在于,所述步骤5的A方案、B方案和所述步骤2的C方案具体如下:
所述A方案:M=M+设定值、N、O不变;
所述B方案:N=N+设定值、M=M-设定值、O不变;
所述C方案:M=M+设定值、N=N+设定值、O=O+设定值;
在执行所述步骤5的A方案、B方案和所述步骤2的C方案之前,还包括执行以下步骤:
默认步骤:默认左侧音量M、右侧音量N、背部音量O等于默认值;
在执行完所述步骤5的A方案、B方案和所述步骤2的C方案之后,还包括执行以下步骤:
限制最高音量步骤:通过M或者N或者O是否不大于设定音量,来判断音量是否为最高,如果是,则执行步骤6,否则返回执行步骤1。
4.根据权利要求2所述的多喇叭播放方法,其特征在于,在所述A方案、所述B方案、所述C方案中,所述设定值为10;在所述默认步骤中,所述默认值等于50db;在所述限制最高音量步骤,所述设定音量为90db。
5.一种提高声源拾音准确度的多喇叭播放装置,其特征在于,包括:
开始单元:用于基准输出开始;
声纹识别单元:用于声纹识别发出语音者是否为机主;如果是,进入多麦阵列识别单元,否则,进入输出单元;
多麦阵列识别单元:用于多麦阵列识别声源的方位是...
【专利技术属性】
技术研发人员:张波,吴彦兵,
申请(专利权)人:深圳小辣椒科技有限责任公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。