【技术实现步骤摘要】
语音识别方法、语音识别装置、可读存储介质和电子设备
本专利技术公开涉及信息处理
,具体涉及一种语音识别方法、语音识别装置、可读存储介质和电子设备。
技术介绍
随着信息技术的不断发展,语音识别技术也在迅速地发展。现有的语音识别技术通常使用HMM(HiddenMarkovModel,隐马尔科夫模型)混合语音识别系统获取语音识别信息。由于HMM混合语音识别系统需要根据现有的声学模型(例如,高斯混合模型)来对语音训练数据的状态进行校准,并根据从状态对齐产生的声学特征和训练目标,训练神经网络获取状态后验概率,这种分离的方式会导致HMM混合语音识别系统的语音识别准确率较低。
技术实现思路
有鉴于此,本专利技术实施例提出了一种语音识别方法、语音识别装置、可读存储介质和电子设备,能够提高语音识别的准确率。第一方面,本专利技术实施例提供了一种语音识别方法,所述方法包括:将输入序列输入预定的神经网络模型获取多个第一向量,其中,所述输入序列为声学特征向量的序列,所述第一向量为所述神经网络模型的最后一个隐层输出的隐藏特征向量,每个隐藏特征向量对应于一个声学特征向量;根据所述第一向量和多 ...
【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:将输入序列输入预定的神经网络模型获取多个第一向量,其中,所述输入序列为声学特征向量的序列,所述第一向量为所述神经网络模型的最后一个隐层输出的隐藏特征向量,每个隐藏特征向量对应于一个声学特征向量;根据所述第一向量和多个投影矩阵获取一个所述声学特征向量对应的多个第二向量;根据所述多个第二向量获取对应的所述声学特征向量的第三向量;根据所述第三向量确定所述输入序列对应的概率分布序列;根据所述概率分布序列确定每个声学特征向量对应的标签,所述标签用于表征音素或字符。
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:将输入序列输入预定的神经网络模型获取多个第一向量,其中,所述输入序列为声学特征向量的序列,所述第一向量为所述神经网络模型的最后一个隐层输出的隐藏特征向量,每个隐藏特征向量对应于一个声学特征向量;根据所述第一向量和多个投影矩阵获取一个所述声学特征向量对应的多个第二向量;根据所述多个第二向量获取对应的所述声学特征向量的第三向量;根据所述第三向量确定所述输入序列对应的概率分布序列;根据所述概率分布序列确定每个声学特征向量对应的标签,所述标签用于表征音素或字符。2.根据权利要求1所述的方法,其特征在于,所述第二向量通过如下公式计算:(li,1,…,li,n)=tanh([M1,…,Mn]Thi)其中,li,j为所述第二向量,(li,1,…,li,n)为所述第二向量的序列,tanh为第一激活函数,Mj为所述投影矩阵,j=1…n为所述投影矩阵的数量,hi为所述第一向量,i=1…t为所述第一向量的数量,所述投影矩阵通过预先训练获得。3.根据权利要求1所述的方法,其特征在于,所述根据所述多个第二向量获取对应的所述声学特征向量的第三向量包括:根据所述第一向量和权重矩阵获取对应的多个第四向量;根据所述多个第四向量和所述多个第二向量获取对应的所述第三向量。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一向量和权重矩阵获取对应的多个第四向量包括:根据所述第一向量和所述权重矩阵获取第五向量;根据所述第五向量和第二激活函数获取对应的所述第四向量。5.根据权利要求4所述的方法,其特征在于,所述第五向量通过如下公式计算...
【专利技术属性】
技术研发人员:施阳阳,黄美玉,雷欣,
申请(专利权)人:出门问问信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。