基于自然语言处理的语音识别方法、装置、设备及介质制造方法及图纸

技术编号：29493903 阅读：30 留言：0更新日期：2021-07-30 19:06

本发明专利技术公开了基于自然语言处理的语音识别方法、系统、设备及介质，方法包括：提取语音信息的音频特征信息并通过困惑网络解析得到拼音信息及初始文本信息，分别对拼音信息及初始文本信息进行转换得到拼音编码序列及初始字符编码序列并进行叠加组合得到组合编码序列，根据文本纠错模型对组合编码序列进行纠错得到纠错编码序列，对纠错编码序列进行逆转换得到文本识别信息。本发明专利技术属于基于自然语言处理技术领域，基于上述困惑网络对语音信息进行解析，并通过文本纠错模型对组合编码序列进行纠错处理最终得到文本识别结果，可对初始识别得到的初始文本信息中存在的文本错误进行纠正，从而大幅提升对语音信息进行识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于自然语言处理的语音识别方法、装置、设备及介质
本专利技术涉及基于自然语言处理
，属于智慧城市中基于自然语言处理对语音信息进行智能识别的应用场景，尤其涉及一种基于自然语言处理的语音识别方法、装置、设备及介质。
技术介绍
随着语音识别技术的快速发展，在采用智能语音客服代替人工客服、在智能语音家居等场景中得到了越来越广泛的应用，可通过语音识别技术构建识别模型对用户输入的语音信息进行识别处理，以得到相应的识别结果，并根据识别结果执行对应的程序或获取对应的答复信息。然而专利技术人发现，现有的语音识别技术中通常是对语音信息进行识别以得到对应拼音信息，对拼音信息进行语义解析得到文本信息，然而现有技术经常会因匹配精度的问题而导致识别结果中存在文本错误，错误形式通常包括插入错误、替换错误和删除错误，导致难以获取准确对语音信息进行识别得到文本识别结果。因此，现有的语音识别方法存在难以准确对语音信息进行识别的问题。
技术实现思路
本专利技术实施例提供了一种基于自然语言处理的语音识别方法、装置、设备及介质，旨在解决现有...

【技术保护点】
1.一种基于自然语言处理的语音识别方法，其特征在于，所述方法包括：/n若接收到用户输入的语音信息，根据预置的音频特征提取模型从所述语音信息中提取得到音频特征信息；/n根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息；/n根据预置的转换词典分别对所述拼音信息及所述初始文本信息进行转换得到对应的拼音编码序列及初始字符编码序列；/n对所述拼音编码序列及所述初始字符编码序列进行叠加组合得到所述语音信息的组合编码序列；/n将所述组合编码序列输入预置的文本纠错模型进行纠错以得到对应的纠错编码序列；/n根据所述转换词典对所述纠错编码序列进行逆转换得到与所述语音信息对应的文本识别信息。/...

【技术特征摘要】
1.一种基于自然语言处理的语音识别方法，其特征在于，所述方法包括：
若接收到用户输入的语音信息，根据预置的音频特征提取模型从所述语音信息中提取得到音频特征信息；
根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息；
根据预置的转换词典分别对所述拼音信息及所述初始文本信息进行转换得到对应的拼音编码序列及初始字符编码序列；
对所述拼音编码序列及所述初始字符编码序列进行叠加组合得到所述语音信息的组合编码序列；
将所述组合编码序列输入预置的文本纠错模型进行纠错以得到对应的纠错编码序列；
根据所述转换词典对所述纠错编码序列进行逆转换得到与所述语音信息对应的文本识别信息。

2.根据权利要求1所述的基于自然语言处理的语音识别方法，其特征在于，所述音频特征提取模型包括频谱转换规则、频率转换公式及逆变换规则，所述根据预置的音频特征提取模型从所述语音信息中提取得到音频特征信息，包括：
对所述语音信息进行分帧处理得到对应的多帧音频信息；
根据预置的单位时间及所述频谱转换规则将每一所述单位时间内包含的所述音频信息转换为对应的音频频谱；
根据所述频率转换公式将每一所述音频频谱转换为对应的非线性音频频谱；
根据所述逆变换规则对每一所述非线性音频频谱进行逆变换得到与每一所述非线性音频频谱对应的多个音频系数作为所述音频特征信息。

3.根据权利要求1所述的基于自然语言处理的语音识别方法，其特征在于，所述根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息，包括：
根据所述困惑网络中标准拼音信息与标准音频特征信息的对应关系，获取与所述音频特征信息相匹配的一条拼音信息；
根据所述困惑网络中标准拼音信息与字符之间的关联关系，获取所述困惑网络中与所述拼音信息对应的字符串联形成的多条可选文本信息；
计算所述困惑网络中每一所述可选文本信息的路径相似度，并从所述多条可选文本信息中获取路径相似度最高的一条可选文本信息作为初始文本信息。

4.根据权利要求1所述的基于自然语言处理的语音识别方法，其特征在于，所述对所述拼音编码序列及所述初始字符编码序列进行叠加组合得到所述语音信息的组合编码序列，包括：
将所述拼音编码序列中每一个拼音编码值与所述字符编码序列中对应的一个字符编码值进行相加，得到对应的第一编码序列；
将所述拼音编码序列中每一个拼音编码值与所述字符编码序列中对应的一个字符编码值进行顺序拼接，得到对应的第二编码序列；
将所述第一编码序列与所述第二编码序列进行组合作为对应的组合编码序列。

5.根据权利要求1所述的基于自然语言处理的语音识别方法，其特征在于，所述根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息之前，还包括：
根据所述音频特征提取模型分别从预存的标准数据集合包含的标准语音信息中提取得到对应的标准音频特征信息；
从所述标准音频特征信息中获取所述标准数据集合的标准...

【专利技术属性】
技术研发人员：康海梅，魏韬，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人