【技术实现步骤摘要】
语音识别模型的训练方法、语音交互方法及装置
[0001]本公开涉及人工智能技术中的语音技术和深度学习技术,可以应用于人机交互等语音识别的场景,尤其涉及一种语音识别模型的训练方法、语音交互方法及装置。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)技术的发展,语音交互技术有了新的突破,且被广泛地应用于各种场景,语音识别是语音交互中的重要环节,为了提高语音交互的有效性,可以训练语音识别置信度模型,以对语音识别的识别结果的可靠性进行评价。
[0003]在现有技术中,通常采用的语音识别模型的训练方法包括:通过人工的方式对线上数据进行标注,以得到样本语音数据,并基于样本语音数据训练得到语音识别置信度模型。
[0004]然而,采用人工的方式对线上数据进行标注,需要耗费较大的人力,且样本语音数据的质量容易受人为主观因素的影响,导致训练的可靠性偏低的技术问题。
技术实现思路
[0005]本公开提供了一种用于降低成本的语音识别模型的训练方法、语音交互方法及装置。 />[0006]根据本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音识别模型的训练方法,包括:获取语音交互先验信息,并基于所述语音交互先验信息生成初始语音数据;获取实际语音数据,并将所述实际语音数据添加至所述初始语音数据中,得到样本语音数据;根据所述样本语音数据训练得到语音识别置信度模型,所述语音识别置信度模型用于语音交互场景中的语音交互。2.根据权利要求1所述的方法,其中,基于所述语音交互先验信息生成初始语音数据,包括:根据所述语音交互先验信息确定所述初始语音数据的语音句式信息,并生成与所述语音句式信息对应的语音文本;对每一语音文本进行语音合成处理,得到所述初始语音数据。3.根据权利要求2所述的方法,其中,所述语音交互先验信息包括:专家语音信息、语音识别相关的语音信息、语音句式相关的语音信息中的至少一种。4.根据权利要求1至3中任一项所述的方法,其中,根据所述样本语音数据训练得到语音识别置信度模型,包括:对所述样本语音数据进行解码处理,得到语音特征和文本特征,并根据所述语音特征和所述文本特征训练得到所述语音识别置信度模型。5.根据权利要求4所述的方法,其中,根据所述语音特征和所述文本特征训练得到所述语音识别置信度模型,包括:根据所述语音特征获取所述样本语音数据中的预设易错词,并根据所述预设易错词对所述语音特征进行调整,得到调整后的语音特征;根据所述文本特征和所述调整后的语音特征,训练得到所述语音识别置信度模型。6.根据权利要求5所述的方法,其中,根据所述预设易错词对所述语音特征进行调整,得到调整后的语音特征,包括:从预先设置的负例组对中获取与所述预设易错词对应的替换词,其中,所述负例对组用于表征易错词与替换词之间的对应关系;将所述替换词对所述预设易错词进行替换处理,得到所述调整后的语音特征。7.根据权利要求4至6中任一项所述的方法,其中,根据所述语音特征和所述文本特征训练得到所述语音识别置信度模型,包括:对所述语音特征和所述文本特征进行识别处理,得到与所述样本音频数据对应的识别结果;基于所述识别结果对预设基础网络模型的参数进行调整,得到所述语音识别置信度模型。8.根据权利要求7所述的方法,其中,基于所述识别结果对预设基础网络模型的参数进行调整,得到所述语音识别置信度模型,包括:计算所述识别结果与预设标准结果之间的编辑距离,并根据所述编辑距离确定所述识别结果的识别标签类型,所述识别标签类型为正例标签或者负例标签;根据所述识别标签类型和预设标准标签类型对所述基础网络模型的参数进行调整,得到所述语音识别置信度模型。
9.根据权利要求1至8中任一项所述的方法,在将所述实际语音数据添加至所述初始语音数据中,得到样本语音数据之后,还包括:对所述样本语音数据进行降噪处理。10.一种语音交互方法,包括:获取用户发起的交互语音数据,对所述交互语音数据进行识别,得到待分析识别结果;基于语音识别置信度模型对所述待分析识别结果进行分析,得到所述待分析识别结果的语音置信度,其中,所述语音识别置信度模型是基于如权利要求1至9中任一项所述的方法得到的;根据所述语音置信度确定用于反馈所述交互语音数据的反馈语音数据。11.根据权利要求10所述的方法,其中,对所述交互语音数据进行识别,得到待分析识别结果,包括:对所述交互语音数据进行降噪处理,得到降噪处理后的语音数据,并对所述降噪处理后的语音数据进行识别,得到所述待分析识别结果。12.根据权利要求10或11所述的方法,其中,所述待分析识别结果包括待识别语音特征和待识别文本特征;对所述交互语音数据进行识别,得到待分析识别结果,包括:对所述交互语音数据进行解码处理,得到待识别语音特征和待识别文本特征。13.一种语音识别模型的训练装置,包括:第一获取单元,用于获取语音交互先验信息;生成单元,用于基于所述语音交互先验信息生成初始语音数据;第二获取单元,用于获取实际语音数据;添加单元,用于将所述实际语音数据添加至所述初始语音数据中,得到样本语音数据;训练单元,用于根据所述样本语音数据训练得到语音识别置信度模型,所述语音识别置信度模型用于语音交互场景中的语音交互。14.根据权利要求13所述的装置,其中,所述生成单元,包括:确定子单元,用于根据所述语音交...
【专利技术属性】
技术研发人员:魏晨闯,付晓寅,臧启光,王佳伟,刘兵,吴震,彭星源,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。