【技术实现步骤摘要】
【国外来华专利技术】上下文感知的基于硬件的语音活动检测
[0001]相关申请的交叉引用
[0002]本申请要求于2020年5月29日提交的美国临时专利申请No.16/888,522的利益和优先权,其全部内容通过援引纳入于此。
[0003]引言
[0004]本公开的各方面涉及功率高效语音活动检测,尤其涉及用于执行上下文感知的基于硬件的语音活动检测的系统和方法。
[0005]语音活动检测一般是由电子设备实现以激活设备或设备的一些功能的功能。例如,它可允许人向电子设备(诸如智能扬声器、移动设备、可穿戴设备等)给予命令,而不直接与该设备物理地交互。语音活动检测常常被实现为电子设备中的“常开”功能以使其效用最大化。不幸的是,常开功能需要常开软件和/或硬件资源,这进而导致常开功率使用。移动电子设备、物联网(IoT)设备等对此类常开功率要求特别敏感,因为它们缩短了电池寿命并且消耗了系统的其他有限资源,诸如处理能力。
[0006]常规地,由于常规实现的性能限制,语音活动检测已经被实现为高准确度、高功率功能、或低准确度、低功率功能。例如,由于对移动应用的严 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种被配置成用于执行语音活动检测的处理系统,包括:存储器,所述存储器包括计算机可执行指令;一个或多个处理器,所述一个或多个处理器被配置成执行所述计算机可执行指令并使所述处理系统:从音频源接收音频数据;使用基于硬件的特征生成器基于所接收的音频数据来生成多个模型输入特征;基于由基于硬件的语音活动检测模型基于所述模型输入特征生成的输出值来确定所述音频数据中的语音活动的存在。2.如权利要求1所述的处理系统,其中为了使用所述基于硬件的特征生成器来生成所述多个模型输入特征,所述一个或多个处理器被进一步配置成使所述处理系统:预处理所接收的音频数据以生成域变换输入数据;使用域变换电路基于所述域变换输入数据来生成多个频带输出;从来自所述域变换电路的所述多个频带输出中选择频带输出子集;以及确定所述频带输出子集中的每个频带输出的信噪比,其中每个频带输出的每个信噪比是所述多个模型输入特征中的一模型输入特征。3.如权利要求2所述的处理系统,其中所述基于硬件的特征生成器包括硬件实现的快速傅立叶变换电路。4.如权利要求2所述的处理系统,其中为了确定所述频带输出子集中的每个频带输出的所述信噪比,所述一个或多个处理器被进一步配置成使所述处理系统:确定所述频带输出子集中的每个频带输出的噪声本底;将对数函数应用于所述频带输出子集中的每个频带输出的所述噪声本底;确定所述频带输出子集中的每个频带输出的信号功率电平;以及将对数函数应用于所述频带输出子集中的每个频带输出的所述信号功率电平,其中所述频带输出子集中的每个频带输出的所述信噪比包括对数信噪比。5.如权利要求2所述的处理系统,其中为了预处理所接收的音频数据,所述一个或多个处理器被进一步配置成使所述处理系统:将所接收的音频数据拆分成第一音频数据流和第二音频数据流;将延迟函数应用于所述第二音频数据流以生成经延迟的第二音频数据流;将窗函数应用于所述第一音频数据流和经延迟的第二音频数据流;以及将串行至并行转换应用于所述第一音频数据流和经延迟的第二音频数据流。6.如权利要求1所述的处理系统,其中所述基于硬件的语音活动检测模型包括硬件实现的SVM模型。7.如权利要求6所述的处理系统,其中所述硬件实现的SVM模型包括:第一多列SVM电路;以及第二单列SVM电路,所述第二单列SVM电路被配置成生成所述输出值。8.如权利要求6所述的处理系统,其中所述一个或多个处理器被进一步配置成使所述处理系统:将用于所述硬件实现的SVM模型的多个模型参数加载到所述存储器中。9.如权利要求2所述的处理系统,其中所述频带输出子集包括八个频带输出。10.如权利要求1所述的处理系统,其中所述音频源包括所述处理系统的一个或多个麦
克风。11.一种用于执行语音活动检测的方法,包括:从电子设备的音频源接收音频数据;使用基于硬件的特征生成器基于所接收的音频数据来生成多个模型输入特征;基于由基于硬件的语音活动检测模型基于所述模型输入特征生成的输出值来确定所述音频数据中的语音活动的存在。12.如权利要求11所述的方法,其中使用所述基于硬件的特征生成器来生成所述多个模型输入特征包括:预处理所接收的音频数据以生成域变换输入数据;使用域变换电路基于所述域变换输入数据来生成多个频带输出;从来自所述域变换电路的所述多个频带输出中选择频带输出子集;以及确定所述频带输出子集中的每个频带输出的信噪比,其中每个频带输出的每个信噪比是所述多个模型输入特征中的一模型输入特征。13.如权利要求12所述的方法,其中所述基于硬件的特征生成器包括硬件实现的快速傅立叶变换电路。14.如权利要求12所述的方法,其中确定所述频带输出子集中的每个频带输出的所述信噪比包括:确定所述频带输出子集中的每个频带输出的噪声本底;将对数函数应用于所述频带输出子集中的每个频带输出的所述噪声本底;确定所述频带输出子集中的每个频带输出的信号功率电平;以及将对数函数应用于所述频带输出子集中的每个频带输出的所述信号功率电平,其中所述频带输出子集中的每个频带输出的所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。