深圳市声扬科技有限公司专利技术

深圳市声扬科技有限公司共有130项专利

  • 本申请公开了一种声纹信息提取方法、装置、电子设备及存储介质。方法包括:通过声纹提取模型对目标语音信息进行处理,得到对应目标语音信息的目标协方差、目标方差以及目标均值;通过声纹提取模型中的双线性参数层对目标协方差进行降维处理,得到目标一维...
  • 本申请公开了一种车辆音频控制方法、装置、车辆及存储介质。方法包括采集目标车辆的车厢内的音频信号作为目标音频信号;在目标音频信号满足预设条件的情况下,通过声音分类模型确定目标音频信号的分类结果,作为目标分类结果;在预设策略集中确定与目标分...
  • 本申请公开了一种身份识别方法、身份识别装置、电子设备及存储介质,身份识别方法包括获取用户登录虚拟场景的用户信息;当对用户信息验证成功时,获取用户信息对应的身份标识;获取用户的验证音频信息;将身份标识编码至验证音频信息,获得编码音频信息;...
  • 本申请公开了一种设备控制方法、装置、电子设备及存储介质,方法包括:采集待处理语音信息,通过预设滤波器对待处理语音信息进行处理,获得处理后的语音信息,预设滤波器的自适应滤波器系数通过偏差系数进行修正,偏差系数基于预设唤醒词的声纹信息以及历...
  • 本申请公开了一种拾音控制方法、拾音控制装置、电子设备及存储介质,拾音控制方法包括获取拾音器拾取的语音信息;当确定语音信息包含多个人声数据时,确定多个人声数据中是否包含拾音器关联的目标声纹信息;当确定多个人声数据中包含拾音器关联的目标声纹...
  • 本申请实施例公开了一种音频检测方法、装置、电子设备和存储介质,具体公开来:根据第一检测模式获取第一对象的第一待检测音频的第一情绪检测结果;当第一用户的第一待检测音频的情绪异常时,对第一待检测音频进行第一音频处理;根据第二检测模式获取第二...
  • 本申请公开了一种异常语音数据检测方法、装置、计算机设备及存储介质,应用于语音检测技术领域,该方法包括:获取历史语音数据,并根据历史语音数据,获得第一语料集合,获取第二语料集合,并根据第二语料集合和第一语料集合,得到代表词集合,当对第i个...
  • 本申请的语音指令识别方法、装置、电子设备和存储介质,涉及语音处理技术领域。具体包括:获取目标用户的目标语音数据;根据目标语音数据确定第一待比对信息;获取预设语音指令的第二待比对信息;若根据第一待比对信息和第二待比对信息,确定目标语音数据...
  • 本申请公开了一种语音数据处理方法、装置、计算机设备及存储介质,应用于数据处理技术领域,该方法包括:获取待处理语音数据进行语音识别,得到待处理语音数据对应的音素标签数据;将音素标签数据与待处理语音数据进行对齐,得到音素对齐结果;根据音素对...
  • 本申请公开了一种虚拟场景中的音频处理方法、装置、电子设备及存储介质,包括:确定虚拟场景中关联了场景音频的候选场景元素;确定在虚拟场景中目标用户与各候选场景元素之间的相对距离;根据候选场景元素与目标用户之间的相对距离,和场景音频对应的音量...
  • 本申请公开了一种门禁通话控制方法、门禁通话控制装置、门禁及存储介质,门禁通话控制方法应用于门禁对讲系统,门禁通话控制方法包括获取室内成员的室内语音信息;当检测到来访指令,且根据室内语音信息确定室内只存在预设用户时,对室内语音信息进行语音...
  • 本申请公开了一种声纹识别模型的训练方法、声纹识别方法及相关设备包括:获取多个样本音频和声纹标签;声纹识别模型中的各特征提取网络层基于样本音频逐层进行特征提取,得到特征信息;由分类层根据特征信息进行声纹分类,得到样本声纹分类结果;根据样本...
  • 本申请公开了一种语音增强方法、装置、计算机设备及存储介质。该方法包括获取语音数据;基于预先训练的语音增强模型,获取语音数据的人声检测结果、信噪比检测结果以及语音增益参数,所述人声检测结果用于表征语音数据中人声部分对应的数据,所述信噪比检...
  • 本申请实施例提供一种语音文本错误处理方法、装置、电子设备及存储介质,涉及数据处理技术领域。通过获取标准语料和用户语料;分别对标准语料和用户语料进行分词,得到标准语料对应的第一字符串和用户语料对应的第二字符串,其中,第一字符串和第二字符串...
  • 本申请实施例公开了一种声纹识别方法、装置以及电子设备。该方法包括:获取待识别语音;通过声纹模型获取待识别语音对应的第一声纹特征;通过识别模型获取第一声纹特征对应的第二声纹特征,其中,识别模型为基于指定训练数据进行训练得到,指定训练数据至...
  • 本申请公开了一种活体检测模型的训练方法、装置、设备及存储介质,涉及语音识别技术领域。该方法包括:获取用于模型训练的音频样本集;基于多种特征提取算法中的每种特征提取算法,分别提取音频样本集中的音频样本对应的多种第一音频特征;将音频样本输入...
  • 本申请实施例公开了一种模型生成方法、异常检测方法、装置以及电子设备。所述方法包括:获取训练数据集,所述训练数据集包括目标设备的多个音频信息各自的第一音频特征,所述多个音频信息包括正常音频信息和异常音频信息;通过所述训练数据集对待训练生成...
  • 本申请公开了一种语谱图的显示处理方法,涉及语音识别技术领域。该方法包括:获取待处理音频对应的原始语谱图以及文本信息;显示所述原始语谱图以及所述文本信息;响应于选择的所述文本信息中的指定文本的语谱图查看指令,获取与所述指定文本对应的语谱图...
  • 本申请公开了一种语谱图的处理方法、装置、电子设备及存储介质,该方法包括:在目标音频的语音识别结果中进行指定内容搜索,确定指定内容所对应的音段在目标音频中的时间位置信息;根据时间位置信息,在目标音频的语谱图中确定候选音段对应的至少两个分段...
  • 本申请公开了一种音频信息处理方法:获取样本音频和检材音频;对样本音频和检材音频进行语音分段处理,得到样本音段信息和检材音段信息;根据音段匹配规则对样本音频和检材音频进行音段匹配,若样本音频和检材音频之间存在至少一组匹配音段,则将每组匹配...