【技术实现步骤摘要】
一种智能家居语音识别模型的生产方法
本专利技术涉及智能家居领域和语音识别
,尤其涉及一种智能家居语音识别模型的生产方法。
技术介绍
随着人工智能技术的发展和人们生活水平的提高,智能家居产品渐渐走进了人们的生活。目前来说,智能家居产品智能化的主要途径就是语音识别能力。而语音识别能力的高低直接影响用户体验,从而决定该产品是否可用。语音识别能力的高低是模型和解码器共同作用的结果,该模型是声学模型和解码图的总称。在不同的智能家居项目中,命令词是不同的,但解码器往往可以通用,而模型需要根据命令词重新生产,这个过程是复杂且耗时的。模型的生产流程包括但不限于数据采集、数据审核处理、语言和声学模型训练,模型测试,调参迭代。小型的智能家居语音识别系统一般要支持二十个左右的命令词,而一个支持二十个左右的命令词的语音识别模型生产周期至少需要两周,而这个生产周期的确定还是建立在语音识别技术掌握足够成熟,生产工具足够自动化的情况下的。这种模型生产方式是智能家居语音识别模型的主流生产方式。经过分析,我们可以看出这种模型生产方式存在 ...
【技术保护点】
1.一种智能家居语音识别模型的生产方法,其特征在于,包括生产数据文件的固定、生产系统的搭建以及生产流程的介绍,包括以下步骤:/nS1、汉语音素统计及合并,字词与音素的映射文件建立;/nS2、汉语语音识别数据搜集;/nS3、构建kaldi支持的发音词典以及训练数据;/nS4、特征提取,TDNN-HMM模型训练;/nS5、训练网络调优迭代;/nS6、保存全音素声学模型和决策树;/nS7、防误识别参数确定。/n
【技术特征摘要】
1.一种智能家居语音识别模型的生产方法,其特征在于,包括生产数据文件的固定、生产系统的搭建以及生产流程的介绍,包括以下步骤:
S1、汉语音素统计及合并,字词与音素的映射文件建立;
S2、汉语语音识别数据搜集;
S3、构建kaldi支持的发音词典以及训练数据;
S4、特征提取,TDNN-HMM模型训练;
S5、训练网络调优迭代;
S6、保存全音素声学模型和决策树;
S7、防误识别参数确定。
2.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S1具体包括:
汉语全部音素确定,形成音素表,所述音素表是汉语所有字和词与自定义的音素的映射文件;根据智能家居语音识别的应用场景和人类发音特点,对相近音素进行合并,以提高声学模型的鲁棒性。
3.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S2具体包括:
汉语开源语音数据搜集,可搜集到至少1000小时的音频数据。
4.根据权利要求2所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S3具体包括:所述发音词典由所述确定和合并后的音素按kaldi的格式构造而成,并按kaldi的格式处理数据;
步骤S4具体包括:利用kaldi提取搜集来的大数据的MFCC特征,并搭建一个TDNN-HMM网络,训练所述的确定和合并后的音素。
5.根据权利要求1所述的一种智能家居语音识别模型的生产方法,其特征在于,步骤S5、S6具体包括:
根据智能家居语音识别实际应用场景,设置合理的测试集,根据此测试集对步骤S4中的声学模型网络参数调优,寻求出在嵌...
【专利技术属性】
技术研发人员:高亚龙,谢世波,丁伟,吴学伟,宋继海,
申请(专利权)人:深圳市伟文无线通讯技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。