一种面向航天专业领域的语音识别系统和方法技术方案

技术编号:27598632 阅读:14 留言:0更新日期:2021-03-10 10:19
本发明专利技术的一个实施例公开了一种面向航天专业领域的语音识别系统和方法,系统包括:由第一长短时记忆网络构成的编码器,用于输入声学特征序列,经过编码后,输出声学特征序列对应的隐藏表示;由第二长短时记忆网络构成的预测网络,首先输入文本序列起始符号sos,输出文本序列第一个词对应的隐藏表示,之后每次都输入上一个词的嵌入向量,经过预测网络后输出预测后的词对应的隐藏表示;由第三长短时记忆网络构成的偏置编码网络,用于输入航天领域的专业词汇序列,输出航天领域的专业词汇序列对应的隐藏表示;由多层感知机构成的融合网络,融合上述三个网络的输出结果,预测出文本序列的下一个词。下一个词。下一个词。

【技术实现步骤摘要】
一种面向航天专业领域的语音识别系统和方法


[0001]本专利技术涉及电子信息
更具体地,涉及一种面向航天领域的语音识别系统和方法。

技术介绍

[0002]语音交互是最为自然的一种人机交互方式。语音交互的核心是语音识别,即将语音转换为文本,供计算机进行后续处理。近年来,语音识别已经取得了巨大的突破,走入人们的实际应用中。同时,随着航天技术的发展,人类已经有机会进入太空。使航天员更自然更方便地与设备进行交互与控制,已经成为一个必要的技术。航天领域的语音识别系统,需要其更低地占用系统资源,更小的计算代价,同时,对于航天设备的专业词汇要识别得更为精准。
[0003]目前,已经有很多语音识别的技术与系统,如基于隐马尔可夫的大词汇量语音识别系统等,在诸多商业产品中得到了应用。这些大词汇量连续语音识别系统往往基于加权有限状态转换器构建解码网络。解码网络的体积很大,导致解码过程中搜索的计算代价也很大。整个系统的存储和内存占用很高,而且解码时的功耗也很大,限制了其在航天领域的应用。然而,如果过于压缩解码网络的大小,则会大大损害识别系统的性能,导致错误率大大提升。
[0004]因此,需要一种新的面向航天领域的语音识别方法和系统,既能降低计算代价和存储占用,又能对航天领域专业词汇和日常用语进行高效准确的识别。

技术实现思路

[0005]本专利技术提供了一种面向航天专业领域的语音识别系统和方法,解决目前语音识别系统计算代价高,对专业词汇识别准确率低的问题。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]本专利技术第一方面提供了一种面向航天专业领域的语音识别系统,包括:
[0008]由第一长短时记忆网络构成的编码器,用于输入基于信号处理的特征提取器提取的声学特征序列,经过编码后,输出声学特征序列对应的隐藏表示;
[0009]由第二长短时记忆网络构成的预测网络,首先输入文本序列起始符号sos,经过预测网络,输出文本序列第一个词对应的隐藏表示,之后每次都输入上一个词的嵌入向量,经过预测网络后输出预测后的词对应的隐藏表示;
[0010]由第三长短时记忆网络构成的偏置编码网络,用于输入航天领域的专业词汇序列,经过编码后,输出航天领域的专业词汇序列对应的隐藏表示;
[0011]由多层感知机构成的融合网络,输入所述由第一长短时记忆网络构成的编码器、由第二长短时记忆网络构成的预测网络和由第三长短时记忆网络构成的偏置网络三个网络的输出结果,预测出文本序列的下一个词。
[0012]在一个具体实施例中,所述由第一长短时记忆网络构成的编码器根据如下公式编
码提取的声学特征序列:
[0013]h
t
=LSTM(h
i-1
,x
t
)
[0014]其中,LSTM为长短时记忆网络的单元函数,h
t
为t时刻的声学特征序列对应的隐藏表示,h
t-1
为第t-1时刻的声学特征序列对应的隐藏表示,x
t
为t时刻的声学特征序列。
[0015]在一个具体实施例中,所述由第二长短时记忆网络构成的预测网络根据如下公式,得到对应文本序列中每个词的隐藏表示:
[0016]c
j
=LSTM(c
j-1
,y
j
)
[0017]其中,LSTM为长短时记忆网络的单元函数,c
j-1
为第j-1位置的词对应的隐藏表示,y
j
为j位置的词的嵌入向量。
[0018]在一个具体实施例中,所述由第三长短时记忆网络构成的偏置编码网络,根据如下公式,获得航天领域的专业词汇序列对应的隐藏表示:
[0019]b
k
=LSTM(b
k-1
,z
k
)
[0020]其中,LSTM为长短时记忆网络的单元函数,b
k-1
为第k-1位置航天领域的专业词汇序列的字对应的隐藏表示,z
k
为航天领域的专业词汇序列k位置字的嵌入向量。
[0021]在一个具体实施例中,所述多层感知机构成的融合网络,融合由第一长短时记忆网络构成的编码器、由第二长短时记忆网络构成的预测网络和由第三长短时记忆网络构成的偏置网络三个网络的输出结果,根据如下公式来预测文本序列的下一个词:
[0022]P(y
j+1
)=MLP([c
j
,b
k
,y
j
])
[0023]其中,MLP为多层感知机的函数。
[0024]在一个具体实施例中,在识别阶段,根据Viterbi算法从如下公式中搜索出最优的文本序列,具体包括:
[0025]y*=argmax(trans(x,z,y))
[0026]其中,trans表示整个语音识别系统模型,argmax表示取概率最大值对应的那个词,x表示声学特征序列,z表示航天领域的专业词汇序列,y表示所有文本序列,y*表示最优文本序列。
[0027]在一个具体实施例中,所述系统可响应于用户提供航天领域的专业词汇序列z,识别出对应的航天领域的专业词汇。
[0028]本专利技术第二方面提供一种利用本专利技术第一方面所述系统进行训练的方法,通过以下损失函数进行训练:
[0029][0030]其中,θ表示整个神经网络的参数,a表示包含插入填充符号的文本序列,y表示标注的文本序列,x表示声学特征序列,z表示航天领域专业词汇序列。
[0031]本专利技术第三方面提供一种利用本专利技术第二方面训练好的系统进行语音识别的方法,包括:
[0032]将基于信号处理的特征提取器提取的声学特征序列输入所述训练好的系统,经由第一长短时记忆网络构成的编码器,输出声学特征序列对应的隐藏表示;
[0033]在训练好的系统中,将文本序列起始符号sos输入由第二长短时记忆网络构成的
预测网络,输出文本序列第一个词对应的隐藏表示,之后每次都输入上一个词的嵌入向量,经过预测网络后输出预测后的词对应的隐藏表示;
[0034]在训练好的系统中,将航天领域的专业词汇序列输入第三长短时记忆网络构成的偏置编码网络,经过编码后,输出航天领域的专业词汇序列对应的隐藏表示;
[0035]在训练好的系统中,由多层感知机构成的融合网络融合所述由第一长短时记忆网络构成的编码器、由第二长短时记忆网络构成的预测网络和由第三长短时记忆网络构成的偏置网络三个网络的输出结果,预测出文本序列的下一个词。
[0036]本专利技术第四方面提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本专利技术第二方面或本专利技术第三方面中任一方面所述的方法。
[0037]本专利技术第五方面提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向航天专业领域的语音识别系统,其特征在于,包括:由第一长短时记忆网络构成的编码器,用于输入基于信号处理的特征提取器提取的声学特征序列,经过编码后,输出声学特征序列对应的隐藏表示;由第二长短时记忆网络构成的预测网络,首先输入文本序列起始符号sos,经过预测网络,输出文本序列第一个词对应的隐藏表示,之后每次都输入上一个词的嵌入向量,经过预测网络后输出预测后的词对应的隐藏表示;由第三长短时记忆网络构成的偏置编码网络,用于输入航天领域的专业词汇序列,经过编码后,输出航天领域的专业词汇序列对应的隐藏表示;由多层感知机构成的融合网络,输入所述由第一长短时记忆网络构成的编码器、由第二长短时记忆网络构成的预测网络和由第三长短时记忆网络构成的偏置网络三个网络的输出结果,预测出文本序列的下一个词。2.根据权利要求1所述的系统,其特征在于,所述由第一长短时记忆网络构成的编码器根据如下公式编码提取的声学特征序列:h
t
=LSTM(h
t-1
,x
t
)其中,LSTM为长短时记忆网络的单元函数,h
t
为t时刻的声学特征序列对应的隐藏表示,h
t-1
为第t-1时刻的声学特征序列对应的隐藏表示,x
t
为t时刻的声学特征序列。3.根据权利要求1所述的系统,其特征在于,所述由第二长短时记忆网络构成的预测网络根据如下公式,得到对应文本序列中每个词的隐藏表示:c
j
=LSTM(c
j-1
,y
j
)其中,LSTM为长短时记忆网络的单元函数,c
j-1
为第j-1位置的词对应的隐藏表示,y
j
为j位置的词的嵌入向量。4.根据权利要求1所述的系统,其特征在于,所述由第三长短时记忆网络构成的偏置编码网络,根据如下公式,获得航天领域的专业词汇序列对应的隐藏表示:b
k
=LSTM(b
k-1
,z
k
)其中,LSTM为长短时记忆网络的单元函数,b
k-1
为第k-1位置航天领域的专业词汇序列的字对应的隐藏表示,z
k
为航天领域的专业词汇序列k位置字的嵌入向量。5.根据权利要求1所述的系统,其特征在于,所述多层感知机构成的融合网络,融合...

【专利技术属性】
技术研发人员:温正棋李博刘进涛任斌李振龙周仔恒
申请(专利权)人:北京仿真中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1