方言识别方法、装置、设备及存储介质制造方法及图纸

技术编号：32293399 阅读：70 留言：0更新日期：2022-02-12 20:03

本发明专利技术涉及人工智能技术，揭露了一种方言识别方法，包括：接收用户输入的方言语音数据，提取所述方言语音数据的语音特征；利用预构建的方言模型库中所有方言识别模型对应的训练数据逐一与所述语音特征进行相似度检测，得到所述语音特征与每一种所述训练数据的相似度分值；将所述相似度分值最高的训练数据对应的方言识别模型作为目标方言识别模型；利用所述目标方言识别模型对所述方言语音数据进行转换，得到所述方言语音数据对应的语音识别结果。本发明专利技术还提出一种方言识别装置、电子设备以及存储介质。本发明专利技术可以解决方言识别精度低的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
方言识别方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种方言识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]语随着社会的发展，越来越多的软件：如输入法、导航软件、智能问答系统等，都要使用到语言识别技术。语音识别技术正逐步成为信息技术中人机交互的关键技术。目前语音识别多为对普通话进行识别，而方言作为一个地方特色语言，仍有一大批人还在使用，尤其是一些年龄比较大的人不会说普通话只会说方言因此，对方言的语音识别也是一个重要的研究课题。
[0003]目前的方言识别大多通过对一个模型进行方言训练，再利用训练好的模型对方言进行识别，然而方言种类千差万别，每一种方言识别模型可能只能识别一种或者几种方言，因此，通常需要训练很多种方言识别模型，并将所述多种方言识别模型汇集在一起，形成多方言识别模型，但是所述多方言识别模型在使用时，由于不了解用户输入的方言种类，导致不能精确的选择适合的方言识别模型，从而使得方言识别的准确性不高。

技术实现思路

[0004]本专利技术...

【技术保护点】

【技术特征摘要】
1.一种方言识别方法，其特征在于，所述方法包括：接收用户输入的方言语音数据，提取所述方言语音数据的语音特征；利用预构建的方言模型库中所有方言识别模型对应的训练数据逐一与所述语音特征进行相似度检测，得到所述语音特征与每一种所述训练数据的相似度分值；将所述相似度分值最高的训练数据对应的方言识别模型作为目标方言识别模型；利用所述目标方言识别模型对所述方言语音数据进行转换，得到所述方言语音数据对应的语音识别结果。2.如权利要求1所述的方言识别方法，其特征在于，所述提取所述方言语音数据的语音特征，包括：将所述语音数据中的声音信号转化为数字信号；利用预设的三角带通滤波器对所述数字信号进行计算，得到所述语音数据对应的语音特征。3.如权利要求2所述的方言识别方法，其特征在于，所述利用预设的三角带通滤波器对所述数字信号进行计算，得到所述语音数据对应的语音特征，包括：对所述数字信号进行预加重、分帧和加窗处理，得到频域能量；对所述频域能量进行快速傅里叶变换，得到频谱；利用所述三角带通滤波器对所述频谱进行计算，得到对数能量；对所述对数能量进行离散余弦变换，得到梅尔频率倒谱系数；根据所述梅尔频率倒谱系数进行差分计算，得到动态差分参数，并确定所述动态差分参数为语音特征。4.如权利要求1所述的方言识别方法，其特征在于，所述利用预构建的方言模型库中所有方言识别模型对应的训练数据逐一与所述语音特征进行相似度检测，得到所述语音特征与每一种所述训练数据的相似度分值，包括：逐一提取每一种所述方言识别模型的训练数据的语音特征；计算所述训练数据的语音特征与所述用户输入的方言语音数据的语音特征的距离值；根据所述距离值计算得到所述用户输入的方言语音数据的语音特征与每一种所述训练数据的语音特征相似度分值。5.如权利要求1所述的方言识别方法，其特征在于，所述利...

【专利技术属性】
技术研发人员：汪雪，程刚，蒋志燕，陈诚，
申请(专利权)人：深圳市北科瑞声科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人