一种提高具有声音触发预设置的听力设备和系统触发精度的方法技术方案

技术编号:21574206 阅读:17 留言:0更新日期:2019-07-10 16:07
一种提高具有声音触发预设置的听力设备和系统触发精度的方法,其包括:接收一组外部设备的输入信号至听力设备或系统的音频数据接口;分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道,用于听力设备或系统执行语音触发识别;根据分离得到的信号触发预设的声控指令,以便当前的听力设备或系统继续执行其功能。

A Method for Improving the Accuracy of Triggering Audio Devices and Systems with Preset Sound Trigger

【技术实现步骤摘要】
一种提高具有声音触发预设置的听力设备和系统触发精度的方法
本公开涉及信号处理
,尤其涉及一种提高具有声音触发预设置的听力设备和系统触发精度的方法。本专利技术的方法致力于提高具有视觉/运动传感器的听力设备和系统的声音触发精度。
技术介绍
当前通过声音触发的听力设备和系统,目标声音经常会受到无用干扰信号(如其他人的语音)的干扰,因此面临的一个巨大挑战是如何提高用于触发听力设备和系统的预置声音信号的信噪比。消除这类干扰信号最常用的方法是利用模拟或数字形式的滤波器。但是,目标触发声音信号和干扰信号经常共用一个频段,滤波器很难将它们分离开来。所幸的是,多数情况下目标触发声音和干扰信号来自于不同物理位置的发射源,这意味着目标触发声音和干扰信号到达观察点之前所经过的路径是不同的,这种传播路径的差异使得信号的衰减呈现出某种固定模式,从而有助于将目标触发声音信号和干扰信号分离开来。但实际上,信号的路径差异也会产生不同的时间延迟从而严重破坏衰减模式的稳定性,使得信号分离无法实现。同样的问题也发生在具有视觉/运动传感器的听力设备和系统。例如产生360度全景视频和360度环绕音的设备,如果使用者的头部或身体的其他部位移动时,360度全景视频将随之移动。但是,360度环绕音无法根据当前用户所处的方位来放大对应位置的声音信号作为声音输入感知。因此,当前急需一种能有效地将目标触发声音信号和干扰信号分离出来并通过选择性放大来提升目标触发信号感知的技术。同时也急需一种能根据用户头部或身体其他部位的移动将用户方位的声音放大的技术。公开内容鉴于现有技术中对目标触发声音信号和干扰信号分离的不足,本专利技术的致力于提供一种提高具有声音触发预设置的听力设备和系统触发精度的方法。为实现上述目标,本公开的一方面是提供一种提高具有声音触发预设置的听力设备和系统触发精度的方法,其包括:接收一组外部设备的输入信号至听力设备或系统的音频数据接口;分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道,用于听力设备或系统执行语音触发识别;根据分离得到的信号触发预设的声控指令,以便当前的听力设备或系统继续执行其功能。基于上述方法,所述分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道的步骤包括:步骤301:提高所述每两个输入信号的独立性;步骤302:计算提高所述独立性所产生的系数矩阵,所述系数处于实时持续预估状态中;步骤303:检测干扰信号片段,或者先行预计优选的干扰信号的相对方向,或者选择来自所有相对方向的干扰信号;步骤304:检测麦克风与音频重放装置的相对位置,以便计算实时的时间延迟;步骤305:同步化处理每一组输入信号;步骤306:通过同步化的信号矩阵和步骤202确定的系数矩阵的乘法运算,同步后的输入信号分离为含有目标干扰信号的频道和不含目标干扰信号的频道;步骤307:智能选择不含目标干扰信号的频道作为信号输出。基于上述方法,优选地,根据独立成分分析(ICA)提高所述输入信号的独立性。基于上述方法,优选地,基于获取的时间延迟,或基于由预定方向的杂音段或干扰信号计算得来的时间延迟,或基于所有可能的相对方向计算的一整套的时间延迟,同步化处理每一组输入信号。基于上述方法,优选地,所述输入信号由不同位置的麦克风接收。本公开的另一方面是提供一种提高具有声音触发预设置的听力设备和系统触发精度的方法,包括:步骤2001:运行预设的声音触发系统判定是否能触发听力设备或系统,如果能,听力设备或系统继续执行步骤2012的功能,否则,执行步骤2002;步骤2002:经由听力设备或系统的音频数据接口接收一组外部设备的输入信号;步骤2003,判定是否记录有优选的输入信号,如果有,执行步骤2004,否则执行步骤2009;步骤2004,判定是否记录有优选的输入信号的时间延迟,如果有,执行步骤2005,否则执行步骤2007;步骤2005,两种优选的输入信号根据优选的时间延迟ch1和ch2被分离到两个通道;步骤2006,运行预设的声音触发系统判定是否能触发听力设备或系统,如果能,听力设备或系统继续执行步骤2011的功能,否则,执行步骤2007;步骤2007,每两种优选的输入信号根据所有可能的时间延迟ch1,ch2……chm,被分离到两个通道;步骤2008,运行预设的声音触发系统判定是否能触发听力设备或系统,如果能,听力设备或系统继续执行步骤2011的功能,否则,执行步骤2009;步骤2009,每两种输入信号根据所有可能的时间延迟ch1,ch2……chn,被分离到两个通道;步骤2010,运行预设的声音触发系统判定是否能触发听力设备或系统,如果能,听力设备或系统继续执行步骤2011的功能,否则,终止程序执行;步骤2011,如果检测到声音触发指令,则将触发的两条输入信号记录为步骤2003的优选输入信号,将触发的时间延迟记录为步骤2004中优选的输入信号的优选时间延迟;步骤2012,听力设备或系统继续执行其功能。所述方法可应用于具有多麦克风的智能扬声器或具有多麦克风的声控机器人,或其他智能声控设备。上述应用设备都包含有声控触发指令,该指令能识别预设的语音命令从而触发系统或设备继续执行其功能。另一方面,本专利技术还披露一种提高具有视觉/运动传感器的听力设备和系统的音效的方法,包括:步骤4100:接收一组外部设备的输入信号至听力设备或系统的音频数据接口;步骤4200:接收来自于视觉/运动传感器的信号;步骤4300:根据视觉/运动传感器的信号计算优选的时间延迟;步骤4400:根据优选的时间延迟,用信号分离技术分离得到输入信号进入听力设备或系统;步骤4500:选择性放大从优选方向传来的声音。根据上述方法,优选地,所述输入信号包括多种彼此并不相同的干扰信号。根据上述方法,优选地,优选的时间延迟根据使用者的视觉方向计算得出。本专利技术的方法可应用于360度环绕音设备,VR音频设备,游戏视频设备或其他具有360度环绕音的产品和系统。附图说明下面将参照附图对本公开的实施方式进行示例而非限制性的描述。附图是示范性的且不受图中表现出来的比例尺的限制。不同附图中相同的或相似的元件采用相同的符号标记。图1是本公开实施例的一种提高具有声音触发预设置的听力设备和系统触发精度的方法的操作流程图;图2是本公开实施例的一种提高具有声音触发预设置的听力设备和系统触发精度的解决方案的操作流程图;图3是本公开的将输入信号分离为含有用信号的频道和含杂音信号的频道的操作流程图;图4是本公开实施例的一种提高来自优选方向的进入具有视觉/运动传感器的听力设备和系统的声音信号的方法流程图。具体实施方式下文将结合附图详细描述本公开的具体实施例。图1是本公开实施例的一种提高具有声音触发预设置的听力设备和系统触发精度的方法1000的流程图。在步骤100中,一组外部设备的输入信号经由听力设备或系统的音频数据接口接收,每条输入信号(观测信号)均含有目标触发声音。此外,该输入信号还可以包括多种彼此并不相同的干扰信号。可以理解的是,输入信号中的这些干扰信号也可以是相同的,本专利技术对此并无特殊限制。例如,就智能扬声器而言,智能扬声器通常包含至少两个麦克风以及声音触发指令。每个麦克风都可接收由发声源(包含预设的声音触发指令)和环境背景音效(干本文档来自技高网...

【技术保护点】
1.一种提高具有声音触发预设置的听力设备和系统触发精度的方法,其特征在于,包括:步骤100:接收一组外部设备的输入信号至听力设备或系统的音频数据接口;步骤200:分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道,用于听力设备或系统执行语音触发识别;步骤300:根据分离得到的信号触发预设的声控指令,以便当前的听力设备或系统继续执行其功能。

【技术特征摘要】
1.一种提高具有声音触发预设置的听力设备和系统触发精度的方法,其特征在于,包括:步骤100:接收一组外部设备的输入信号至听力设备或系统的音频数据接口;步骤200:分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道,用于听力设备或系统执行语音触发识别;步骤300:根据分离得到的信号触发预设的声控指令,以便当前的听力设备或系统继续执行其功能。2.根据权利要求1所述的方法,其特征在于,所述分离输入信号为含有目标干扰信号的频道和不含目标干扰信号的频道的步骤包括:步骤301:提高所述每两个输入信号的独立性;步骤302:计算提高所述独立性所产生的系数矩阵,所述系数处于实时持续预估状态中;步骤303:检测干扰信号片段,或者先行预计优选的干扰信号的相对方向,或者选择来自所有相对方向的干扰信号;步骤304:检测麦克风与音频重放装置的相对位置,以便计算实时的时间延迟;步骤305:同步化处理每一组输入信号;步骤306:通过同步化的信号矩阵和步骤202确定的系数矩阵的乘法运算,同步后的输入信号分离为含有目标干扰信号的频道和不含目标干扰信号的频道;步骤307:智能选择不含目标干扰信号的频道作为信号输出。3.根据权利要求2所述的方法,其特征在于,基于独立成分分析(ICA)提高所述输入信号的独立性。4.根据权利要求2所述的方法,其特征在于,基于获取的时间延迟,或基于由预定方向的杂音段或干扰信号计算得来的时间延迟,或基于所有可能的相对方向计算的一整套的时间延迟,同步化处理每一组输入信号。5.根据权利要求1-4任一所述的方法,其特征在于,所述输入信号由不同位置的麦克风接收。6.一种提高具有声音触发预设置的听力设备和系统触发精度的方法,其特征在于,包括:步骤2001:运行预设的声音触发系统判定是否能触发听力设备或系统,如果能,听力设备或系统继续执行步骤2012的功能,否则,执行步骤2002;步骤2002:经由听力设备或系统的音频数据接口接收一组外部设备的输入信号;步骤2003,判定是否记录有优选的输入信号,如果有,执行步骤2004,否则执行步骤2009;步骤2004,判定是否记录有优选的输入信号的时间延迟,如果有,执行步骤2005,否则执行步骤2007;步骤2005,两种优选的输入信号根据优选的时间延迟ch1和ch2被分离到两个通道;步骤2006,运行预设的声音触发系统判定...

【专利技术属性】
技术研发人员:张健钢
申请(专利权)人:音科有限公司
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1