数据处理方法、装置、电子设备、程序产品及介质制造方法及图纸

技术编号:35097101 阅读:30 留言:0更新日期:2022-10-01 17:01
本申请实施例公开了数据处理方法、装置、电子设备、程序产品及介质,可应用于数据处理技术领域。其中方法包括:根据目标时间窗内的K个语音帧的语音数据分别对应的音频特征,确定目标时间窗的语音数据是否命中命令词;当目标时间窗的语音数据命中命令词时,确定与当前语音帧关联的验证时间窗;确定验证时间窗内的语音数据与每个命令词对应的第一置信度,并确定验证时间窗对应的关联特征;基于每个命令词对应的第一置信度以及关联特征确定命中的结果命令词。采用本申请实施例,有助于提升对语音数据的命令词检测的准确度。本申请实施例还可应用于云技术、人工智能、智慧交通、辅助驾驶、智能家电等各种场景。智能家电等各种场景。智能家电等各种场景。

【技术实现步骤摘要】
数据处理方法、装置、电子设备、程序产品及介质


[0001]本申请涉及数据处理
,尤其涉及一种数据处理方法、装置、电子设备、程序产品及介质。

技术介绍

[0002]目前,语音检测技术得到了广泛的应用,许多智能设备(如车载系统、智能音箱、智能家电等等)中设置有语音检测功能,智能设备可以接收通过语音的形式发布的指令,基于接收到的语音数据检测其中的指令,并执行对应的操作。然而,专利技术人在实践过程中发现,在检测语音数据中的指令时,对语音数据中的命令词的检测的准确度较低。

技术实现思路

[0003]本申请实施例提供了一种数据处理方法、装置、电子设备、程序产品及介质,有助于提升对语音数据的命令词检测的准确度。
[0004]一方面,本申请实施例公开了一种数据处理方法,所述方法包括:
[0005]确定当前语音帧对应的目标时间窗,并获取所述目标时间窗内的K个语音帧的语音数据分别对应的音频特征,K为正整数;
[0006]根据所述K个语音帧的语音数据分别对应的音频特征,确定所述目标时间窗的语音数据是否命中命令词集中的命令本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:确定当前语音帧对应的目标时间窗,并获取所述目标时间窗内的K个语音帧的语音数据分别对应的音频特征,K为正整数;根据所述K个语音帧的语音数据分别对应的音频特征,确定所述目标时间窗的语音数据是否命中命令词集中的命令词,所述命令词集中包括至少一个命令词;当所述目标时间窗的语音数据命中所述命令词集中的命令词时,确定与所述当前语音帧关联的验证时间窗;根据所述验证时间窗内的多个语音帧的语音数据分别对应的音频特征,确定所述验证时间窗内的语音数据与所述命令词集中每个命令词分别对应的第一置信度,并基于所述验证时间窗中的语音数据确定所述验证时间窗对应的关联特征;基于所述每个命令词分别对应的第一置信度以及所述关联特征确定所述验证时间窗的语音数据在所述命令词集中命中的结果命令词。2.根据权利要求1所述方法,其特征在于,所述根据所述K个语音帧的语音数据分别对应的音频特征,确定所述目标时间窗的语音数据是否命中命令词集中的命令词,包括:根据所述K个语音帧的语音数据分别对应的音频特征,确定所述目标时间窗的语音数据与所述命令词集中每个命令词相对应的第二置信度;若所述命令词集中存在第二置信度大于或等于第一阈值的命令词,则确定所述目标时间窗的语音数据命中所述命令词集中的命令词;若所述命令词集中不存在第二置信度大于或等于第一阈值的命令词,则确定所述目标时间窗的语音数据没有命中所述命令词集中的命令词。3.根据权利要求2所述方法,其特征在于,所述基于所述每个命令词分别对应的第一置信度以及所述关联特征确定所述验证时间窗的语音数据在所述命令词集中命中的结果命令词,包括:基于所述每个命令词对应的第二置信度、所述每个命令词分别对应的第一置信度以及所述关联特征进行拼接处理,得到验证特征;基于所述验证特征确定所述验证时间窗的语音数据与所述每个命令词对应的第三置信度;若所述命令词集中存在第三置信度大于或等于第二阈值的命令词,则将第三置信度大于或等于第二阈值且第三置信度最大的命令词确定为所述验证时间窗的语音数据在所述命令词集中命中的结果命令词。4.根据权利要求1所述方法,其特征在于,所述基于所述每个命令词分别对应的第一置信度以及所述关联特征确定所述验证时间窗的语音数据在所述命令词集中命中的结果命令词,包括:基于所述每个命令词分别对应的第一置信度以及所述关联特征,确定所述验证时间窗的语音数据与所述每个命令词对应的第三置信度;若所述命令词集中存在第三置信度大于或等于第二阈值的命令词,则将第三置信度大于或等于第二阈值且第三置信度最大的命令词确定为所述验证时间窗的语音数据在所述命令词集中命中的结果命令词。5.根据权利要求1所述方法,其特征在于,所述命令词集中的所述每个命令词具有多个
音节;所述确定与所述当前语音帧关联的验证时间窗,包括:获取音节输出单元集,所述音节输出单元集是基于所述每个命令词具有的多个音节确...

【专利技术属性】
技术研发人员:陈杰苏丹
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1