一种智能家居语音识别模型的生产方法技术

技术编号:25805969 阅读:31 留言:0更新日期:2020-09-29 18:40
本发明专利技术涉及智能家居产品和语音识别技术领域,公开了一种智能家居语音识别模型的生产方法。对于智能家居语音识别模型的生产流程,通常的基本流程是每次根据命令词采集数据、审核处理数据、声学模型训练调参等。本发明专利技术提供了一种一劳永逸的方法,即通过对音素处理、大量数据搜集以及训练网络优化等方法固定一个通用的全音素的声学模型和决策树,每次生产模型只需要提供命令词,无需再次采集处理数据训练声学模型,根据命令词自动构建解码图即可完成模型生产,并且该模型自动平衡好准确率与误识率的关系,生产过程只需几秒钟,大大缩短了模型生产周期。并且有效地解决目前智能家居语音识别模型的通用生产方式存在的生产成本高、模型复用性太低、数据利用率太低的问题。

【技术实现步骤摘要】
一种智能家居语音识别模型的生产方法
本专利技术涉及智能家居领域和语音识别
,尤其涉及一种智能家居语音识别模型的生产方法。
技术介绍
随着人工智能技术的发展和人们生活水平的提高,智能家居产品渐渐走进了人们的生活。目前来说,智能家居产品智能化的主要途径就是语音识别能力。而语音识别能力的高低直接影响用户体验,从而决定该产品是否可用。语音识别能力的高低是模型和解码器共同作用的结果,该模型是声学模型和解码图的总称。在不同的智能家居项目中,命令词是不同的,但解码器往往可以通用,而模型需要根据命令词重新生产,这个过程是复杂且耗时的。模型的生产流程包括但不限于数据采集、数据审核处理、语言和声学模型训练,模型测试,调参迭代。小型的智能家居语音识别系统一般要支持二十个左右的命令词,而一个支持二十个左右的命令词的语音识别模型生产周期至少需要两周,而这个生产周期的确定还是建立在语音识别技术掌握足够成熟,生产工具足够自动化的情况下的。这种模型生产方式是智能家居语音识别模型的主流生产方式。经过分析,我们可以看出这种模型生产方式存在三点弊端:1,生产成本文档来自技高网...

【技术保护点】
1.一种智能家居语音识别模型的生产方法,其特征在于,包括生产数据文件的固定、生产系统的搭建以及生产流程的介绍,包括以下步骤:/nS1、汉语音素统计及合并,字词与音素的映射文件建立;/nS2、汉语语音识别数据搜集;/nS3、构建kaldi支持的发音词典以及训练数据;/nS4、特征提取,TDNN-HMM模型训练;/nS5、训练网络调优迭代;/nS6、保存全音素声学模型和决策树;/nS7、防误识别参数确定。/n

【技术特征摘要】
1.一种智能家居语音识别模型的生产方法,其特征在于,包括生产数据文件的固定、生产系统的搭建以及生产流程的介绍,包括以下步骤:
S1、汉语音素统计及合并,字词与音素的映射文件建立;
S2、汉语语音识别数据搜集;
S3、构建kaldi支持的发音词典以及训练数据;
S4、特征提取,TDNN-HMM模型训练;
S5、训练网络调优迭代;
S6、保存全音素声学模型和决策树;
S7、防误识别参数确定。


2.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S1具体包括:
汉语全部音素确定,形成音素表,所述音素表是汉语所有字和词与自定义的音素的映射文件;根据智能家居语音识别的应用场景和人类发音特点,对相近音素进行合并,以提高声学模型的鲁棒性。


3.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S2具体包括:
汉语开源语音数据搜集,可搜集到至少1000小时的音频数据。


4.根据权利要求2所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S3具体包括:所述发音词典由所述确定和合并后的音素按kaldi的格式构造而成,并按kaldi的格式处理数据;
步骤S4具体包括:利用kaldi提取搜集来的大数据的MFCC特征,并搭建一个TDNN-HMM网络,训练所述的确定和合并后的音素。


5.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S5、S6具体包括:
根据智能家居语音识别实际应用场景,设置合理的测试集,根据此测试集对步骤S4中的声学模型网络参数调优,寻求出在嵌...

【专利技术属性】
技术研发人员:高亚龙谢世波丁伟吴学伟宋继海
申请(专利权)人:深圳市伟文无线通讯技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1