【技术实现步骤摘要】
本专利技术涉及语音转写,具体涉及一种智能语音转写方法及系统。
技术介绍
1、自动语音识别技术是人机交互技术中的重要技术之一。自动语音识别系统在语音助手或听写工具等人机交互系统中普遍存在。智能语音转写方法是指将音频数据通过算法识别转换为文本数据,然而,音频转换文本的准确率受到音频中噪声的严重影响,语音去噪能够改善语音质量,降低噪声污染,提高语音转写时的准确率。
2、其中sg(savitzky-golay smoothing)多项式滤波算法是一种常用的语音去噪技术,sg滤波算法通过局部多项式拟合后的数据代替原数据实现平滑、去噪。然而在语音数据复杂的环境中,sg多项式滤波算法存在对多项式阶数较为敏感的缺陷。采用sg滤波去噪时,较大的阶数能够更好地适应数据的曲线特征,但会导致平滑后的数据失去部分细节信息。较小的阶数则能更好的保留数据的细节信息,但可能无法适应复杂的数据曲线变化,都容易造成语音转写错误。
技术实现思路
1、为了解决上述技术问题,本专利技术的目的在于提供一种智能语音转写方法
...【技术保护点】
1.一种智能语音转写方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述根据各元素的语音边界影响系数得到离散语音序列的各信号区,包括:
3.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述根据各信号区内元素的频域特征得到各信号区的高频序列与低频序列,包括:
4.根据权利要求3所述的一种智能语音转写方法,其特征在于,所述根据各信号区内元素与低频序列中元素的关系得到各信号区的语音低频相似度,表达式为:
5.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述结
...【技术特征摘要】
1.一种智能语音转写方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述根据各元素的语音边界影响系数得到离散语音序列的各信号区,包括:
3.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述根据各信号区内元素的频域特征得到各信号区的高频序列与低频序列,包括:
4.根据权利要求3所述的一种智能语音转写方法,其特征在于,所述根据各信号区内元素与低频序列中元素的关系得到各信号区的语音低频相似度,表达式为:
5.根据权利要求1所述的一种智能语音转写方法,其特征在于,所述结合各信号区的语音低频相似度及信号区内元素的语音边界影响系数得到各信号区的语音低频信号纯净指数,包括:
...
【专利技术属性】
技术研发人员:张忠,李治强,杨静,陈聪,何杰,
申请(专利权)人:广州市艾索技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。