基于连续混合高斯HMM模型的地名语音信号识别方法技术

技术编号：15507852 阅读：124 留言：0更新日期：2017-06-04 02:22

本发明专利技术揭示的基于连续混合高斯HMM模型的地名语音信号识别方法，其中连续混合高斯HMM模型的训练过程如下：定义HMM模型并初始化；将一类地名语音信号的特征矩阵代入模型中进行训练；根据模型参数求出一类地名语音信号出现的概率；将该概率和训练之前的输出概率比较，判断相对误差是否满足输出条件；符合，输出该类地名语音信号对应的HMM模型；不符合，判断训练次数是否达到最高训练阈值；未到达，再训练一次，达到，输出HMM模型；将若干类地名语音信号的特征矩阵代入模型中，得到若干个不同地名对应的HMM模型，形成地名语音识别模型库。本发明专利技术能够有得到适合孤立词的地名语音识别的HMM模型及地名语音识别模型库，为准确进行地名语音识别创造了条件。

Recognition method of place names speech signals based on continuous mixed Gauss HMM model

The names of speech signal recognition method of continuous mixed Gauss model based on HMM is disclosed, in which the training process of continuous hybrid Gauss HMM model as follows: HMM model is defined and initialized; the characteristic matrix of a class of names into the model of speech signal for training; according to the model parameters to obtain the probability of a speech signal names appear; comparing the output probability and probability before the training, the relative error of judging whether meet the output conditions; with the output of the HMM model names corresponding to the speech signal; does not comply with the judgment, the number of training is the highest training does not reach the threshold; then, one training to output HMM model; the characteristic matrix into the model number names of speech signals, the HMM model of several different names corresponding to the formation of the speech recognition model library names. The invention can obtain a HMM model suitable for isolated word place name speech recognition and a geographical name speech recognition model library, thus creating the condition for accurate place name speech recognition.

全部详细技术资料下载

【技术实现步骤摘要】
基于连续混合高斯HMM模型的地名语音信号识别方法
本专利技术涉及地名语音信号识别方法，尤其涉及一种基于连续混合高斯HMM模型的地名语音信号识别方法。
技术介绍
随着经济的高速发展和全球化趋势的日益突出，现代物流行业已在发达国家得到了空前的发展，并产生了巨大的经济效益和社会效益，物流资源有运输、仓储、分拣、包装、配送等，这些资源分散在多个领域，包括制造业、农业、流通业等。在分拣环节中，现阶段基本是人工进行分拣，由于工人们长期处于嘈杂的工作环境中，心里和身体上势必会产生一定的疲劳感，并且工作任务的单一性和重复性也会使他们的工作状态过于放松，这必然导致分拣精确性的下降，造成较多不可挽回的分拣失误事故发生，工业领域中对流水线上的产品分拣进行人工检测的方式已不能满足现代化工业的需求。语音识别发展到现在，作为人机交互的重要借口已经在很多方面改变了我们的生活，从智能家居的语音控制系统到车载语音识别系统，语音识别系统给我们带来了很多方便，因此将语音识别技术与物流分拣环节的融合是物流行业发展的必然要求。而物流分拣环节与语音识别技术结合的关键之一是如何有效地实现地名语音信号的准确识别，从而为自动化地将各类物品精确地归类到设定的地方提供技术支撑，目前鲜有看到针对孤立词的地名进行语音识别的相关技术，因此亟待进行地名语音识别技术的研发。
技术实现思路
本专利技术的目的就是为了解决现有技术中存在的上述问题，提供一种基于连续混合高斯HMM模型的地名语音信号识别方法。本专利技术的目的将通过以下技术方案得以实现：基于连续混合高斯HMM模型的地名语音信号识别方法，包括连续混合高斯HMM模型的训练...

【技术保护点】
基于连续混合高斯HMM模型的地名语音信号识别方法，其特征在于：包括连续混合高斯HMM模型的训练过程及地名语音识别过程，其中，所述连续混合高斯HMM模型的训练过程如下：S1，定义一个包含如下参数的连续混合高斯HMM模型，λ＝(N，M，A，π，B)，其中：N，模型状态数，为4；M，每个状态所对应的高斯函数的个数，每个状态包含3个39维的高斯函数，一个模型中N个状态中每个状态高斯函数个数相同；A，状态转移概率矩阵，A＝{a

【技术特征摘要】
1.基于连续混合高斯HMM模型的地名语音信号识别方法，其特征在于：包括连续混合高斯HMM模型的训练过程及地名语音识别过程，其中，所述连续混合高斯HMM模型的训练过程如下：S1，定义一个包含如下参数的连续混合高斯HMM模型，λ＝(N，M，A，π，B)，其中：N，模型状态数，为4；M，每个状态所对应的高斯函数的个数，每个状态包含3个39维的高斯函数，一个模型中N个状态中每个状态高斯函数个数相同；A，状态转移概率矩阵，A＝{aij}，aij＝P[qt+1＝j/qt＝i],1≤i,j≤N，其中，qt＝i表示在t时刻处在状态i,q(t+1)＝j表示t+1时刻在状态j，整体表示从状态i转换到状态j的概率；π，各状态的起始概率分布，π＝πt，πt＝P[qi＝i],1≤i≤N,其中，π＝πt表示从状态i开始的概率，下标i表示各个状态对应的起始概率；B，输出概率密度函数，B＝{bj(o)}，其中，o为观察向量，M为每个状态包含的高斯函数的个数；cjl为第j个状态第l个混合高斯函数的权，L为正态高斯概率密度函数，μjl为第j个状态第l个混合高斯元的均值矢量，Ujl为第j个状态第l个混合高斯元的协方差矩阵；S2，模型初始化，将初始状态π＝πt向量设置为(1000),状态转移矩阵A在其自身转移和转移到下一个状态的概率均为0.5，每个高斯函数均为39阶的均值为0、方差为1的函数，权重均为1/3；S3，将一类地名语音信号的特征矩阵代入模型中，利用Baum-Welch迭代算法进行一次模型参数训练；所述一类地名语音信号是指将一个地名的所有样本语音信号的特征矩阵数据放到一起，根据均值聚类法k-means进行聚类，分为4类，对应4个状态；S4，根据计算出的模型参数，使用viterbi算法求出一类地名语音信号出现的概率；S5，将该概率和训练之前的输出概率相比较，判断两者的相对误差是否满足输出条件；S6，若符合输出条件，输出该类地名语音信号对应的连续混合高斯HMM模型；S7，若不符合输出条件，判断训练次数是否达到最高训练阈值；S8，若训练次数未到达最高训练阈值，则重复S3-S7步骤，若训练次数达到最高训练阈值，则终止训练，输出连续混合高斯HMM模型；S9，将若干类地名语音信号的特征矩阵代入模型中，重复S3-S8步骤，得到若干个不同地名对应的连续混合高斯HMM模型，所有的连续混合高斯HMM模型数据形成地名语音识别模型库。2.根据权利要求1所述的基于连续混合高斯HMM模型的地名语音信号识别方法，其特征在于：所述S3步骤中，利用Baum-Welch算法计算模型参数的过程如下：S31，用Lagrange数乘法构...

【专利技术属性】
技术研发人员：蔡熙，聂腾云，赖雪军，谢巍，车松勋，
申请(专利权)人：苏州金峰物联网技术有限公司，上海韵达货运有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人