杭州芯声智能科技有限公司专利技术

杭州芯声智能科技有限公司共有23项专利

  • 本发明提供一种自适应阵列麦克风降噪装置,涉及音频处理技术领域。本发明在阵列麦克风上部署有信号预处理模块、自适应滤波器组、DOA方向估计模块、滤波输出选择模块、进一步降噪模块和OLA重叠相加模块;当噪声信号在某些位置频繁变换的时候,根据事...
  • 本实用新型实施例公开了一种骑行头盔耳机及具有该耳机的骑行头盔。该骑行头盔耳机包括主耳机;所述主耳机包括主耳机机壳、主控电路板、扬声器和主耳机受话器;所述扬声器和所述主耳机受话器与所述主控电路板电连接;并且,所述扬声器、所述主耳机受话器和...
  • 本发明提供的一种基于自定义关键词的声纹识别方法,涉及音频识别技术领域。本发明通过声纹数据标记、模型训练、声纹注册和声纹验证的方法实现了一种低计算量、低功耗、高识别率、无云服务支持的离线、本地声纹识别方法;本发明使用一种帧级别音频特征比对...
  • 本发明提供一种基于骨声纹传感器的VAD方法及系统,涉及音频处理技术领域。本发明使用神经网络技术,并结合骨声纹传感器进行数据采集;在训练数据中进行AEC残留语音与环境噪声的混合,提升识别准确率和鲁棒性;本发明使用语音的MFCC特征作为网络...
  • 本发明提供一种基于骨传导耳机的多命令词语音唤醒方法,涉及音频处理技术领域。本发明根据源数据的长度进行统计来确定的训练长度,得到的长度可以涵盖大部分的训练样本,这样既不会浪费训练数据,也不容易造成冗余;采用归一化通道能量PCEN特征训练,...
  • 本发明提供一种带有延时估计功能的回声消除系统,涉及音频处理技术领域。本发明通过使用延时估计模块对设备的声学场景中的近端信号与远端参考信号之间的延时进行估计,锁定延时后设定合理的缓冲区延时参数,防止远端参考信号滞后于近端回声信号从而提升回...
  • 本发明提供一种基于神经网络双讲检测的回声消除方法及系统,涉及音频处理技术领域。本发明通过使用双讲检测结果控制线性前处理中自适应滤波器的更新与否;当检测到远端无人声信号时,停止更新自适应滤波器。防止双讲状态或是远端仅存在环境噪声时自适应滤...
  • 本发明提供一种基于可穿戴设备的神经网络多命令词识别方法及系统,涉及音频处理技术领域。本发明使用神经网络技术,在训练数据中进行多种噪声的混合,提升识别准确率和鲁棒性;使用语音的MFCC特征作为网络的输入,在网络的第一层,使用CNN进行特征...
  • 本发明提供一种基于参数共享的自然语言理解方法,涉及音频处理技术领域。本发明通过建立具备多个编码器的自然语言理解模型,并在反向传播时按照预设顺序依次对编码器中的参数进行更新共享,从而实现低计算量、低功耗、高识别率等优点。使用参数共享的方法...
  • 本发明提供一种SOC多时钟无毛刺切换电路,涉及SOC集成电路领域。本发明通过硬件电路的设置,简化多时钟切换时所需的步骤,系统对时钟进行切换时,仅需在系统寄存器内设置对应的时钟编码,时钟编码通过第一编码器编译为one
  • 本发明提供的一种双注意力训练序列生成方法、装置及可读存储介质,涉及计算机深度学习领域。本发明通过构建面向输入文本中字符的重要度和输入文本中字符对应槽值关联度的双注意力机制模型来生成对应输入文本的双注意力训练序列,槽值关联度根据槽值的qu...
  • 本发明提供的一种ARM侧离线语音合成的方法、装置及存储介质,涉及语音合成技术领域。本发明通过对ARM侧设备部署音素序列生成器、音素—时间标签序列生成器、声学特征生成器和声码器来进行离线语音合成,通过对ARM侧设备部署的各生成器进行进行P...
  • 本发明提供的一种基于姿态传感器的语音活动检测方法,涉及人机交互技术领域。本发明通过将姿态特征数据与声音特征数据进行特征拼接,得到混合特征数据;通过混合特征数据对神经网络模型进行训练,能实现在不同姿态下对语音活动进行准确检测,解决了用户姿...
  • 本发明提供的一种基于深度神经网络的自动语音识别方法,涉及自动语音识别领域。本发明通过采用Log Fbank作为声学特征,只需要40维特征就足够表达声学信号的特征,极大的简化的信号的处理过程和神经网络模型的大小;采用VGG加双向GRU结合...
  • 本发明提供的一种基于Rasa框架的ARM侧离线对话系统、装置及存储介质,涉及人机交互技术领域。本发明通过Rasa框架进行ARM侧离线对话管理,Rasa框架针对对话管理模块可以通过将深度神经网络模型和规则系统进行融合,并且可以针对不同的对...
  • 本发明公开了一种双麦克风语音降噪装置,包括第一麦克风和第二麦克风,所述第一麦克风和第二麦克风在同一水平线上,设定第一麦克风为嘴部0°方向,则第二麦克风为远离嘴部180°方向,且第一麦克风和第二麦克风相距1.1cm‑3cm。本发明还公开了...
  • 本发明公开了一种基于多命令词的语音唤醒方法,接收语音数据,进行CGA模型训练,获取优选神经网络参数;接收语音数据,对每一帧数据进行预处理,获取可供训练的数据,并将数据输入CGA神经网络;进行CGA神经网络训练,输出预测概率值;对输出的预...
  • 本发明公开了一种单声道语音关键词低功耗实时检测方法,包括以下步骤:预处理;提取归一化通道能量特征;得到卷积神经网络层的输出;使用一层门控循环单元神经元,对卷积神经网络层的输出特征结合历史状态进行记忆、更新和重置,最终得到当前帧的新状态;...
  • 本发明公开了一种基于三值量化压缩的VAD实现方法,主要包括数据预处理、神经网络和量化处理部分三个部分,首先对纯净人声数据与噪声数据按不同信噪比进行融合得到原始数据集,然后进行预处理使其数据符合神经网络的计算需求,预处理包括语音信号的预加...
  • 本实用新型公开了一种支持低输入参考频率的混合结构锁相环,包括参考时钟、相位调节模块、频率调节模块、频率振荡器、分频器以及状态和参数控制器,所述参考时钟的输出端分别连接相位调节模块和频率调节模块的输入端;所述相位调节模块和频率调节模块的输...