【技术实现步骤摘要】
通过计算机识别后重新生成进行语音音频增强的方法
本专利技术涉及计算机音频增强处理系统
,具体为通过计算机识别后重新生成进行语音音频增强的方法。
技术介绍
目前,语音增强大多是采用算法进行环境降噪、滤波、分频、压限等方式,或通过使用硬件混合处理的方法降噪并增强说话人语音。传统语音增强方法更多是通过对音频信号本身进行处理而进行的,通过间接的方式增强说话人的语音内容,而不能直接的提取出音频信号中的语音内容进行增强,这会使得语音增强过程中得到一些并不想要的声音结果,且增强效果不稳定,无法保证在不同环境中获得稳定的语音增强效果,增强后的语音对于人类的听觉识别的优化较为有限,无法很好的起到增强人类语音理解力的作用。
技术实现思路
针对现有技术的不足,本专利技术提供了通过计算机识别后重新生成进行语音音频增强的方法,解决了上述
技术介绍
中提出现有传统语音增强方法更多是通过对音频信号本身进行处理而进行的,通过间接的方式增强说话人的语音内容,而不能直接的提取出音频信号中的语音内容进行增强,这会使得语音增强过程中得 ...
【技术保护点】
1.通过计算机识别后重新生成进行语音音频增强的方法,包括以下步骤:/nS1、输入语音音频数据;/nS2、将语音音频进行分割处理;/nS3、将分割音频进行计算机识别处理;/nS4、对计算机识别结果做修正处理;/nS5、结合识别结果和其他标记数据进行计算机语音合成生成增强后语音音频。/n
【技术特征摘要】
1.通过计算机识别后重新生成进行语音音频增强的方法,包括以下步骤:
S1、输入语音音频数据;
S2、将语音音频进行分割处理;
S3、将分割音频进行计算机识别处理;
S4、对计算机识别结果做修正处理;
S5、结合识别结果和其他标记数据进行计算机语音合成生成增强后语音音频。
2.根据权利要求1所述的通过计算机识别后重新生成进行语音音频增强的方法,其特征在于,所述具体包括一下步骤:
S1、输入语音音频数据:输入一段完整的语音音频;
S2、将语音音频进行分割处理:将步骤S1、输入语音音频数据中的完整音频,根据说话的断句判断其分割点,记录下相应的时间戳、时长、相对位置等标记数据,并对音频本身进行切分;
S3、将分割音频进行计算机识别处理:将分割后的音频,通过计算机语音转换技术,将音频内容转换成文字或等价的语音标记元素如字符、拼音、音标、罗马音、发音标记等;
S4、对计算机识别结果做修正处...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。