一种语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:20567637 阅读:37 留言:0更新日期:2019-03-14 09:56
本申请提出一种语音识别方法、装置、设备及存储介质,其中,该方法包括:提取待识别语音数据的语音特征;根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息;根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容。上述语音识别的处理过程识别得到的内容包括语音内容的属性信息和具体的语音内容两方面的信息,可以有效避免由于无法区分语音内容的属性而出现识别混淆的现象,利于提升语音识别准确度。

【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质
本申请涉及语音识别
,尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
端到端的语音识别模型可以对输入的语音数据进行单字、单词的识别,并将识别到的单字、单词合并得到整词或语句。如汉语语音识别模型常将汉字或词语作为建模单元,通过学习输入语音数据与输出汉字或词语之间的对应关系,识别输入语音数据中所包含的汉字或词语,然后由识别得到的汉字或词语合并得到识别文本。有些语种的单字或单词等具有属性特征,用于规定其组成整词或整句时的用法。甚至某些语种的单字或单词具有多重属性,例如在很多黏着语语种中,作为语句元素的某些子词是既能作为词干,又能作为词缀的,当子词作为词干或词缀的属性不同时,其与相邻子词的格属关系不同,构成的整词或语句也不同。而上述端到端的语音识别模型只是单纯地建立语音数据与单字或单词内容的对应关系,对识别到的单字或单词直接进行拼接得到识别结果。当训练不充分时,经常出现单字或单词识别混淆、识别结果拼接错误的现象,导致语音识别不准确。
技术实现思路
基于上述现有的语音识别技术中存在的问题,本申请提出一种语音识别方法、装置、设备及存储介质,用本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:提取待识别语音数据的语音特征;根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息;根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:提取待识别语音数据的语音特征;根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息;根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容。2.根据权利要求1所述的方法,其特征在于,所述属性信息包括语言成分信息,所述语言成分信息表示语音内容在其所构成的整词和/或语句中的成分属性;相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,包括:将所述语音特征输入预先训练的第一解码模型,解码得到所述待识别语音数据的语音内容的语言成分信息;其中,所述第一解码模型至少根据已标注待识别内容的语言成分信息的解码训练特征样本训练得到。3.根据权利要求2所述的方法,其特征在于,所述属性信息还包括词性类型信息;相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,还包括:将所述语音特征,以及所述待识别语音数据的语音内容的语言成分信息,输入预先训练的第二解码模型,解码得到所述待识别语音数据的语音内容的词性类型信息;其中,所述第二解码模型至少根据已标注待识别内容的语言成分信息和词性类型信息的解码训练特征样本训练得到。4.根据权利要求1所述的方法,其特征在于,所述属性信息包括语言成分信息及词性类型信息;其中,所述语言成分信息表示语音内容在其所构成的整词和/或语句中的成分属性;相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,包括:将所述语音特征输入预先训练的第三解码模型,解码得到所述待识别语音数据的语音内容的语言成分信息及词性类型信息;其中,所述第三解码模型至少根据已标注待识别内容的语言成分信息及词性类型信息的解码训练特征样本训练得到。5.根据权利要求1所述的方法,其特征在于,所述根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容,包括:将所述语音特征,以及所述待识别语音数据的语音内容的属性信息,输入预先训练的第四解码模型,解码得到所述待识别语音数据的语音内容;其中,所述第四解码模型至少根据已经标注待识别内容,以及已经标注待识别内容的属性信息的解码训练特征样本训练得到。6.根据权利要求1至5中任一权利要求所述的方法,其特征在于,所述解码训练特征样本包括语音特征样本和文本特征样本。7.根据权利要求6所述的方法,其特征在于,所述语音特征样本由预设的语音编码器对语音训练样本进行语音特征提取得到;以及,所述文本特征样本由预设的文本编码器对文本训练样本进行文本特征提取得到;其中,所述语音编码器至少通过对语音数据样本进行特征提取训练得到,所述文本编码器至少通过对文本数据样本进行特征提取训练得到,并且所述语音编码器和所述文本编码器经过联合训练处理,使所述语音编码器输出的语音特征与所述文本编码器输出的文本特征的特征表征分布相同。8.根据权利要求7所述的方法,其特征在于,所述语音编码器和所述文本编码器的联合训练处理过程,包括:利用预先训练的判别器模型,分别识别所述文本编码器输出的文本特征和所述语音编码器输出的语音特征;其中,所述判别器模型至少通过识别文本特征样本和语音特征样本训练得到;当所述判别器模型能够区分识别所述文本编码器输出的文本特征和所述语音编码器输出的语音特征时,根据所述判别器模型的负交叉熵梯度,对所述文本编码器和所述语音编码器的参数进行校正;重复以上处理,直到所述判别器模型不能区分识别所述文本编码器输出的文本特征和所述语音编码器输出的语音特征。9.根据权利要求8所述的方...

【专利技术属性】
技术研发人员:方昕刘海波汪睿方磊
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1