一种指令音频生成方法、系统、装置与存储介质制造方法及图纸

技术编号:32916400 阅读:23 留言:0更新日期:2022-04-07 12:07
本申请公开了一种指令音频生成方法、系统、装置和存储介质,其中方法包括以下步骤:获取第一音频并计算所述第一音频中每一帧的帧音频能量和帧信噪比;其中,所述第一音频至少包括指令音频,空白音频和噪声音频;根据所述帧音频能量,确定所述空白音频的第一起点帧和第一终点帧;对所述第一起点帧和所述第一终点帧之间的音频进行剪切,得到第二音频;根据所述帧信噪比,在所述第二音频中确定所述噪声音频的第二起点帧和第二终点帧;对所述第二起点帧和所述第二终点帧之间的音频进行剪切,得到指令音频。本方法可以减少需要识别处理的信息量,降低系统识别处理的计算量和时耗,有效提高系统的识别性能。本申请可广泛应用于音频剪切技术领域内。切技术领域内。切技术领域内。

【技术实现步骤摘要】
一种指令音频生成方法、系统、装置与存储介质


[0001]本申请涉及音频剪辑
,尤其是一种指令音频生成方法、系统、装置和存储介质。

技术介绍

[0002]在人们进行交互而发生的语音指令中,识别语音指令的时长会长于语音指令的实际时长,在采集的音频首尾部位以及音节之间均会产生一定时间的空白段,且指令员会在突发情况下对语音指令进行停顿,而突发状况容易产生声音,导致背景噪音可能突然增加,并掺杂在语音指令停顿的空白段时间内,产生与指令内容无关的音频信号,需对整体的指令音频内的信息量进行识别,不仅增加了需要识别处理的信息量,还影响整体的识别性能,对主要内容的识别造成干扰,需要对音频信号中的空白段进行处理,因此亟需一种对音频噪声和空白段进行处理的指令音频生成方法。

技术实现思路

[0003]本申请的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
[0004]为此,本申请实施例的一个目的在于提供一种指令音频生成方法、系统、装置与存储介质,该方法可以根据帧音频能量在音频信号中确定空白音频的位置,通过帧信噪比可以在信号中确定噪本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种指令音频生成方法,其特征在于,包括以下步骤:获取第一音频并计算所述第一音频中每一帧的帧音频能量和帧信噪比;其中,所述第一音频至少包括指令音频,空白音频和噪声音频;根据所述帧音频能量,确定所述空白音频的第一起点帧和第一终点帧;对所述第一起点帧和所述第一终点帧之间的音频进行剪切,得到第二音频;根据所述帧信噪比,在所述第二音频中确定所述噪声音频的第二起点帧和第二终点帧;对所述第二起点帧和所述第二终点帧之间的音频进行剪切,得到指令音频。2.根据权利要求1所述一种指令音频生成方法,其特征在于,所述根据所述帧音频能量,确定所述空白音频的第一起点帧和第一终点帧这一步骤,具体包括:预设低频能量开始门限,低频能量结束门限、高频能量开始门限和高频能量结束门限;根据所述帧音频能量、所述低频能量开始门限和高频能量开始门限,在所述第一音频中确定所述空白音频的第一起点帧;根据所述帧音频能量、所述低频能量结束门限和高频能量结束门限,所述第一音频中确定空白音频的第一终点帧。3.根据权利要求1所述一种指令音频生成方法,其特征在于,所述根据所述信噪比和所述帧音频能量,在所述第二音频中确定所述噪声音频的第二起点帧和第二终点帧这一步骤,具体包括:预设信噪比阈值;历遍比对所述第二音频中每一帧的所述帧信噪比和所述信噪比阈值,在所述第二音频中确定噪声音频的第二起点帧和第二终点帧。4.根据权利要求2所述一种指令音频生成方法,其特征在于,所述根据所述帧音频能量、所述低频能量开始门限和高频能量开始门限,在所述第一音频中确定所述空白音频的第一起点帧这一步骤,具体包括:比对所述帧音频能量和所述低频能量开始门限,得到低频能量开启帧;比对所述帧音频能量和所述高频能量开始门限,得到高频能量开启帧;若所述高频能量开启帧在所述低频能量开启帧回溯的最短音频信号间隔时间内,则以所述高频能量开启帧为第一起点帧;反之,则以所述低频能量开启帧为第一起点帧。5.根据权利要求2所述一种指令音频生成方法,其特征在于,所述根据所述帧音频能量、所述低频能量结束门限和高频能量结束门限,所述第一音频中确定空白音频的第一终点帧这一步骤,具体包括:比对所述帧音频能量和所述低频能...

【专利技术属性】
技术研发人员:王伟
申请(专利权)人:天翼爱音乐文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1