一种标记方法、装置、设备及存储介质制造方法及图纸

技术编号:33127740 阅读:31 留言:0更新日期:2022-04-17 00:39
本申请实施例提供一种标记方法、装置、设备及存储介质,该方法包括:获取待标记音频和唤醒词中的目标音素;确定所述待标记音频中目标音频的第一音素与所述目标音素的相似度,当所述相似度满足预设条件时,采用特征标签标记所述目标音频,所述目标音频为所述待标记音频的首端音频,所述特征标签表征所述目标音频为所述唤醒词的残留音频。本申请实施例提供的方法能够提高标记音频中唤醒词的残留音频的效率。率。率。

【技术实现步骤摘要】
一种标记方法、装置、设备及存储介质


[0001]本申请属于语音识别术领域,尤其涉及一种标记方法、装置、设备及存储介质。

技术介绍

[0002]语音交互在各行业的应用越来越广泛,语音唤醒技术是与终端进行语音交互的门户。目前,终端有时在未采集到完整的唤醒词时,便能够从待机状态切换到工作状态,切换到工作状态后采集到的残留的唤醒词会对用户与终端的后续交互产生不良影响。
[0003]技术人员通过优化语音识别方法减少这种不良影响时,需要先经过人工对音频中唤醒词的残留音频进行标记。
[0004]目前,通过人工标记音频中唤醒词的残留音频效率较低。

技术实现思路

[0005]本申请实施例提供一种标记方法、装置、设备及存储介质,能够提高标记音频中唤醒词的残留音频的效率。
[0006]第一方面,本申请实施例提供一种标记方法,该方法包括:
[0007]获取待标记音频和唤醒词中的目标音素;
[0008]确定待标记音频中目标音频的第一音素与目标音素的相似度,当相似度满足预设条件时,采用特征标签标记目标音频,目标音频为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标记方法,其特征在于,所述方法包括:获取待标记音频和唤醒词中的目标音素;确定所述待标记音频中目标音频的第一音素与所述目标音素的相似度,当所述相似度满足预设条件时,采用特征标签标记所述目标音频,所述目标音频为所述待标记音频的首端音频,所述特征标签表征所述目标音频为所述唤醒词的残留音频。2.根据权利要求1所述的方法,其特征在于,所述待标记音频中包括指令信息的音频,所述方法还包括:接收用户对所述指令信息的音频的标记操作和用户输入的所述指令信息对应的指令文本;响应于所述标记操作,采用指令标签标记所述待标记音频中所述指令信息的音频;将所述特征标签和所述指令标签标记的所述待标记音频记为标记音频,根据所述标记音频和所述标记音频对应的所述指令文本训练指令识别模型,得到目标指令识别模型,所述目标指令识别模型用于剔除所述标记音频中的所述唤醒词的残留音频,并识别所述指令信息的音频,得到所述指令信息对应的所述指令文本。3.根据权利要求1所述的方法,其特征在于,在所述确定所述待标记音频中目标音频的第一音素与所述目标音素的相似度之前,所述方法还包括:根据所述待标记音频的首端音频的振幅变化规律,确定所述目标音频。4.根据权利要求3所述的方法,其特征在于,所述根据所述待标记音频首端音频的振幅变化规律,确定所述目标音频,包括:确定所述待标记音频的首端振幅变化规律为从高降低至零的音频,为所述目标音频。5.根据权利要求1所述的方法,其特征在于,所述目标音素包括所述唤醒词尾端预设长度的音素。6.根据权利要求1所述的方法,其特征在于,所述确定所述待标记音频中目标音频的第一音素与所述目标音素的相似度,当所述相似度满足预设条件时,采用特征标签标记所述目标音频,包括:采用标记模型,确定所述待...

【专利技术属性】
技术研发人员:黄丽莉李良斌陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1