【技术实现步骤摘要】
语音识别方法、语音识别装置及存储介质
本公开涉及神经网络
,尤其涉及一种语音识别方法、语音识别装置及存储介质。
技术介绍
近几年,深度学习可以实现语音识别添加标点符号,但其添加标点符号的时机为整段语音识别完毕后,才可以自动添加标点符号。也就是说,目前的添加标点符号只能应用于离线语音识别。
技术实现思路
本公开提供一种语音识别方法、语音识别装置及存储介质,以至少解决相关技术中,无法实时在语音识别过程中添加标点符号的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种语音识别方法,应用于服务器,该方法包括:接收并将实时语音信号转化为文本;识别所述文本中包含的第t个词;其中,t为正数;将第t个词进行预处理,得到所述第t个词对应的第一向量,所述第一向量用于表示所述第t个词的语义;将所述第一向量输入多层循环神经网络,经过所述多层循环神经网络的各个层的处理,得到第二向量;其中,所述多层循环神经网络至少包括3层,所述第二向量用于表示所述第t个词对应的上下文信息;将所述第 ...
【技术保护点】
1.一种语音识别方法,其特征在于,应用于服务器,所述方法包括:/n接收并将实时语音信号转化为文本;/n识别所述文本中包含的第t个词;其中,t为正数;/n将第t个词进行预处理,得到所述第t个词对应的第一向量,所述第一向量用于表示所述第t个词的语义;/n将所述第一向量输入多层循环神经网络,经过所述多层循环神经网络的各个层的处理,得到第二向量;其中,所述多层循环神经网络至少包括3层,所述第二向量用于表示所述第t个词对应的上下文信息;/n将所述第二向量输入到输出层,获得所述第t个词对应的各个标点符号的概率;/n将概率最大的标点符号,确定为所述第t个词之前的标点符号;/n发送所述实时 ...
【技术特征摘要】
1.一种语音识别方法,其特征在于,应用于服务器,所述方法包括:
接收并将实时语音信号转化为文本;
识别所述文本中包含的第t个词;其中,t为正数;
将第t个词进行预处理,得到所述第t个词对应的第一向量,所述第一向量用于表示所述第t个词的语义;
将所述第一向量输入多层循环神经网络,经过所述多层循环神经网络的各个层的处理,得到第二向量;其中,所述多层循环神经网络至少包括3层,所述第二向量用于表示所述第t个词对应的上下文信息;
将所述第二向量输入到输出层,获得所述第t个词对应的各个标点符号的概率;
将概率最大的标点符号,确定为所述第t个词之前的标点符号;
发送所述实时语音信号对应的包含所述标点符号的文本。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一向量输入多层循环神经网络,经过所述多层循环神经网络的各个层的处理,得到第二向量,包括:
将所述第一向量输入包含N层循环神经网络的多层循环神经网络中的第一层循环神经网络,经过N层循环神经网络的处理,得到所述第二向量;
其中,所述多层循环神经网络中每一层循环神经网络的权重矩阵不同;第N层循环神经网络的输入为第N-1层循环神经网络的输出,第N层循环神经网络的输出为所述第二向量;N为不小于3的正整数。
3.根据权利要求1所述的方法,其特征在于,所述多层循环神经网络包括第一多层循环神经网络和第二多层循环神经网络;所述第一多层循环神经网络至少包括3层,所述第二多层循环神经网络至少包括3层;
所述将所述第一向量输入多层循环神经网络,经过所述多层循环神经网络的各个层的处理,得到第二向量,包括:
将所述第一向量输入所述第一多层循环神经网络,经过所述第一多层循环神经网络的各个层的处理,得到第三向量,所述第三向量用于表示所述第t个词对应的上下文时序信息;
获得第t-1个词和所述第t个词之间的停顿时长,将所述第三向量以及所述停顿时长拼接为第四向量,将所述第四向量输入所述第二多层循环神经网络,经过所述第二多层循环神经网络的各个层的处理,得到所述第二向量。
4.根据权利要求1所述的方法,其特征在于,所述将第t个词进行预处理,得到所述第t个词对应的第一向量,包括:
根据预设词表,获得所述第t个词对应的编号;
查询所述编号与向量之间的对应关系,得到所述第t个词对应的第一向量。
5.一种语音识别装置,其特征在于,包括:接收模块、识别模块、预处理模块、处理模块和发送模块;
所述接收模块,被配置为执行接收并将实时语音信号转化为文本;
所述识别模块,被配置为执行识别所述文本中包含的第t个词;其中,t为正数;...
【专利技术属性】
技术研发人员:许开拓,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。