一种基于深度学习的车载语音控制方法及其系统技术方案

技术编号：22469279 阅读：54 留言：0更新日期：2019-11-06 12:20

本发明专利技术公开一种基于深度学习的车载语音控制方法及其系统，包括以下步骤，信号采集模块，采集车辆内用户的实时音频信号；信号增大电路，接收多个所述信号采集模块产生的电信号加总放大后提供音频输入信号；语音识别模块，所述音频输入信号输入至所述语音识别模块生成识别结果；控制模块，接收匹配的所述指令信号进行指令的执行。本发明专利技术的有益效果：基于深度学习的语音识别在一定程度上提高语音识别的精度，能够更好的理解车辆内用户所表达的语言意图，从而更加准确的语音控制车辆的行动。

A vehicle voice control method and system based on deep learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的车载语音控制方法及其系统
本专利技术涉及语音识别的
，尤其涉及一种基于深度学习的车载语音控制系统及其控制方法。
技术介绍
近年来，伴随着深度学习的发展，语音识别领域也基于深度学习取得新的突破和进展。出现了很多新的语音识别模型，显著提升了识别效果，同时伴随移动设备、智能家居设备和车载信息系统等的普及，语音识别正在越来越多地出现在人们的日常生活中。传统语音识别方法主要是采用模板匹配的方法，这种方法在孤立词的识别可以取得一定的效果，但面对连续大量的语音表达上，识别效果大打折扣。基于深度学习的语音识别方法相对于传统方法，它具有更好的特征提取和推理等能力。将基于深度学习的语音识别技术应用于车载控制系统中，有利于系统更好的从车主的语言中理解车主的意图，从而达到控制车辆的目的。
技术实现思路
本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊，而这种简化或省略不能用于限制本专利技术的范围。鉴于上述现有存在的问题，提出了本专利技术。因此，本专利技术解决的一个技术问题是：为了解决传统语音识别对连续大量语音识别精度较低，从而对车主表达意图理解不够的缺陷。为解决上述技术问题，本专利技术提供如下技术方案：一种基于深度学习的车载语音控制方法，包括以下步骤，信号采集模块，采集车辆内用户的实时音频信号；信号增大电路，接收多个所述信号采集模块产生的电信号加总放大后提供音频输入信号；语音识别模块，所述音频输入信号输入至所述语音识别...

【技术保护点】
1.一种基于深度学习的车载语音控制方法，其特征在于：包括以下步骤，信号采集模块(100)，采集车辆内用户的实时音频信号；信号增大电路(200)，接收多个所述信号采集模块(100)产生的电信号加总放大后提供音频输入信号；语音识别模块(300)，所述音频输入信号输入至所述语音识别模块(300)生成识别结果，根据所述识别结果匹配指令库内与所述识别结果相似度高于设定阈值的指令信号；控制模块(400)，接收匹配的所述指令信号进行指令的执行。

【技术特征摘要】
1.一种基于深度学习的车载语音控制方法，其特征在于：包括以下步骤，信号采集模块(100)，采集车辆内用户的实时音频信号；信号增大电路(200)，接收多个所述信号采集模块(100)产生的电信号加总放大后提供音频输入信号；语音识别模块(300)，所述音频输入信号输入至所述语音识别模块(300)生成识别结果，根据所述识别结果匹配指令库内与所述识别结果相似度高于设定阈值的指令信号；控制模块(400)，接收匹配的所述指令信号进行指令的执行。2.如权利要求1所述的基于深度学习的车载语音控制方法，其特征在于：还包括所述音频输入信号转化为文本信号或直接将文本信号输入至所述语音识别模块(300)中，根据所述文本信号与所述指令库的指令完成匹配后输出指令信号。3.如权利要求1或2所述的基于深度学习的车载语音控制方法，其特征在于：还包括所述语音识别模块(300)的训练步骤，训练语音输入至录制模块(301)录制为粗音频信号；所述粗音频信号输入至加工模块(302)内进行处理加工得到较为纯净的精音频信号；特征提取模块(303)对所述精音频信号进行特征提取并得到特性向量；构建深度学习模型模块(304)，将提取的所述特性向量和文本语料分别作为模型的输入，对所述深度学习模型模块(304)进行训练；待识别语音输入解码模块(305)搜索输出分数最高的词序列作为识别结果。4.如权利要求3所述的基于深度学习的车载语音控制方法，其特征在于：所述深度学习模型模块(304)还包括声学模型和语言模型；所述声学模型将声学和发音学结合，通过对大量语音文件进行训练得到声学模型，识别时对提取的特征进行打分，生成声学模型分数；所述语言模型通过对文本语料作为模型输入进行训练生成，且训练好的所述声学模型能够估计假设词序列的可能性，给出输入语音的词序列的语言模型打分；所述解码模块(305)解码搜索输出分数最高的词序列作为识别结果。5.如权利要求4任一所述的基于深度学习的车载语音控制方法，其特征在于：所述录制模块(301)通过收集文字素材，根据收集到的素材，用麦克风组件录制成音频，录制时语速正常和吐字清晰，同时生成与音频对应的文本作为当下录制音频的标签。6.如权利要求4或5所述的基于深度学习的车载语音控制方法，其特征在于：所述加工模块(302)包括以下加工步骤，采用一阶高通数字滤波器：H(z)＝1-μz-1，其中μ表示系数，取值范围...

【专利技术属性】
技术研发人员：张亮，
申请(专利权)人：的卢技术有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人