一种智能语音转写方法及系统技术方案

技术编号：41328150 阅读：24 留言：0更新日期：2024-05-13 15:06

本发明专利技术涉及语音转写技术领域，具体涉及一种智能语音转写方法及系统，该方法包括：采集语音数据得到离散语音序列，将离散语音序列划分为各信号区，获取各信号区的高频序列与低频序列，获取各信号区的语音低频相似度及语音低频信号纯净指数，利用经验模态分解算法获取各信号区的高频序列的各本征模态分量，获取低频序列及各本征模态分量的频谱包络线，构建各信号区的语音信号区失真系数，结合各信号区的语音信号区失真系数及滤波算法、语音转文本算法完成语音转写。本发明专利技术旨在提高语音转写的准确率，降低噪音干扰。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音转写，具体涉及一种智能语音转写方法及系统。

技术介绍

1、自动语音识别技术是人机交互技术中的重要技术之一。自动语音识别系统在语音助手或听写工具等人机交互系统中普遍存在。智能语音转写方法是指将音频数据通过算法识别转换为文本数据，然而，音频转换文本的准确率受到音频中噪声的严重影响，语音去噪能够改善语音质量，降低噪声污染，提高语音转写时的准确率。

2、其中sg（savitzky-golay smoothing）多项式滤波算法是一种常用的语音去噪技术，sg滤波算法通过局部多项式拟合后的数据代替原数据实现平滑、去噪。然而在语音数据复杂的环境中，sg多项式滤波算法存在对多项式阶数较为敏感的缺陷。采用sg滤波去噪时，较大的阶数能够更好地适应数据的曲线特征，但会导致平滑后的数据失去部分细节信息。较小的阶数则能更好的保留数据的细节信息，但可能无法适应复杂的数据曲线变化，都容易造成语音转写错误。

技术实现思路

1、为了解决上述技术问题，本专利技术的目的在于提供一种智能语音转写方法...

【技术保护点】

1.一种智能语音转写方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述根据各元素的语音边界影响系数得到离散语音序列的各信号区，包括：

3.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述根据各信号区内元素的频域特征得到各信号区的高频序列与低频序列，包括：

4.根据权利要求3所述的一种智能语音转写方法，其特征在于，所述根据各信号区内元素与低频序列中元素的关系得到各信号区的语音低频相似度，表达式为：

5.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述结合各信号区的语音低频...

【技术特征摘要】

1.一种智能语音转写方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述根据各元素的语音边界影响系数得到离散语音序列的各信号区，包括：

3.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述根据各信号区内元素的频域特征得到各信号区的高频序列与低频序列，包括：

5.根据权利要求1所述的一种智能语音转写方法，其特征在于，所述结合各信号区的语音低频相似度及信号区内元素的语音边界影响系数得到各信号区的语音低频信号纯净指数，包括：

...

【专利技术属性】
技术研发人员：张忠，李治强，杨静，陈聪，何杰，
申请(专利权)人：广州市艾索技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人