【技术实现步骤摘要】
基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质
[0001]本专利技术涉及机顶盒的
,尤其是涉及一种基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质。
技术介绍
[0002]目前,随着人工智能技术的发展,通过语音识别获取用户对设备的控制指令,从而通过语音就可以实现人机交互。随着近场语音识别的日渐成熟,人们对复杂音源环境下对语音的识别提出了新的更高的要求,远场语音识别技术应运而生。
[0003]现有的通过语音来控制机顶盒的方式主要分为近场跟远场两种,近场语音需要按住遥控器的语音录入按钮来输入机顶盒操控命令,而现有的远场语音机顶盒虽然可以不依赖于遥控器,直接通过机顶盒的收音模块发出控制语音就可以通过语音的方式控制机顶盒,并且通过语音控制机顶盒进行工作的方式还对一些不便于用手操作的残疾人士或者一些对智能设备不了解的老人带来了极大的便利,然而在声音嘈杂的环境下不容易在众多的声音中识别出机顶盒的控制语音或者在人员和机顶盒的收音装置距离较远的情况下容易产生回音或者捕捉到的语音音量过小,从而不易捕捉到机顶盒实际响应的控 ...
【技术保护点】
【技术特征摘要】
1.一种基于机顶盒的远场拾音唤醒控制方法,其特征在于,所述机顶盒的远场拾音唤醒控制方法包括:实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据,并通过高保真协议传输至麦克风;对所述待处理声音数据进行杂音清洗处理,得到目标声音数据,其中,所述目标声音数据包括控制麦克风切换数据传输协议的协议切换指令;当识别到所述协议切换指令时,控制所述麦克风切换为通过机顶盒低功耗协议传输数据,并识别所述目标声音数据中的机顶盒控制命令,所述机顶盒控制命令包括唤醒指令和控制指令;当识别到唤醒指令时,将所述唤醒指令通过机顶盒低功耗协议传输至机顶盒,以便控制机顶盒进入唤醒状态;当识别到控制指令时,将所述控制指令通过机顶盒低功耗协议传输至唤醒状态下的机顶盒,以便控制机顶盒切换工作状态。2.根据权利要求1所述的基于机顶盒的远场拾音唤醒控制方法,其特征在于,所述实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据,并通过高保真协议传输至麦克风,具体包括:根据麦克风阵列拾取到的若干路原始声音数据对每路原始声音数据进行声源定位,得到每路原始声音数据对应的声源位置;对同一声源位置的每路原始声音数据与预先训练好的远场拾音模型分别进行拟合处理,得到携带有机顶盒控制命令的有效声音片段作为待处理声音数据。3.根据权利要求2所述的基于机顶盒的远场拾音唤醒控制方法,其特征在于,所述根据所述麦克风阵列拾取到的若干路原始声音数据对每路原始声音数据的声源进行定位,得到每路原始声音数据对应的声源位置,具体包括:对携带有相同声音内容的每路所述原始声音数据进行计算,得到每路所述原始声音数据到达麦克风阵列的估计时间差;根据所述估计时间差对每个所述原始声音数据到达麦克风每个阵列的距离进行计算;根据计算结果选取距离最小的原始声音数据的声源位置作为目标声源位置,以便根据所述目标声源位置获取对应的机顶盒控制命令。4.根据权利要求3所述的基于机顶盒的远场拾音唤醒控制方法,其特征在于,所述对携带有相同声音内容的每路所述原始声音数据进行计算,得到每路所述原始声音数据到达麦克风阵列的估计时间差,还包括:将每路原始声音数据划分为若干个携带有声学特征的最小声学单元;将若干路原始声音数据的最小声学单元分别进行声学特征比对;根据比对结果判断每路所述原始声音数据是否携带有相同声音内容;若是,则选取所述最小声学单元匹配程度最高的待处理声音数据进行时延估计运算,得到每路原始声音数据到达麦克风不同阵列的估计时间差。5.根据权利要求2所述的基于机顶盒的远场拾音唤醒控制方法,其特征在于,所述对同一声源位置的每路原始声音数据与预先训练好的远场...
【专利技术属性】
技术研发人员:张思芳,
申请(专利权)人:深圳西米通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。