The embodiment of the invention discloses a voice recognition method and device, and storage medium; the embodiment to the audio data after obtaining the audio data, the fuzzy recognition by DSP, when confirming the existence of wake up words, when the DSP wake up dormant CPU, and the CPU of the audio data semantic analysis, and then according to the analysis results, the implementation of the corresponding operation; the premise of the scheme can be retained in the wake of mobility and speech, greatly reduce the power consumption of the system, thereby prolonging the standby time of the mobile terminal, to improve the performance of mobile terminal.
【技术实现步骤摘要】
语音识别方法、装置和存储介质
本专利技术涉及通信
,具体涉及一种语音识别方法、装置和存储介质。
技术介绍
随着人工智能的发展,智能硬件产品也得到快速发展。所谓智能硬件产品,指的集成了人工智能功能的硬件设备,比如智能移动终端(简称移动终端)等。智能硬件产品的核心必然离不开与“人”的互动,而语音交互作为自然、且学习成本低的交互方式已成为智能硬件产品的主流技术。在语音交互中,如何进行语音唤醒是一个重要的问题。以移动终端为例,在现有技术中,为了实现语音快速唤醒,一般都会要求终端的录音功能一直处于开启状态,且中央处理器(CPU,CentralProcessingUnit)能够随时对音频数据进行处理,即便在用户未说话时,CPU也不能休眠。由于CPU需要对各种音频数据进行编解码、播放、以及实现其他各种功能,因此,该方案对CPU的规格要求较高,而且,整个系统的功耗也非常大,对于使用电池供电的移动终端而言,会大大缩短其待机时间。为此,现有技术又提出了采用外接电源来进行供电,或采用一个物理按键来进行唤醒的方案,但是,若采用外接电源,则势必会影响其移动性,而若通过物理按键来唤醒,则无法实现语音唤醒;也就是说,在现有方案中,若需要保持其移动性和语音唤醒功能,则必然需要消耗大量的电池电量,这将大大减少移动终端的待机时间,影响移动终端的性能。
技术实现思路
本专利技术实施例提供一种语音识别方法、装置和存储介质;可以减少系统功耗,使得在保持移动性和语音唤醒功能的前提下,延长移动终端的待机时间,改善移动终端的性能。本专利技术实施例提供一种语音识别方法,包括:获取音频数据;通过数字信号处 ...
【技术保护点】
一种语音识别方法,其特征在于,包括:获取音频数据;通过数字信号处理器对所述音频数据进行模糊语音识别;当模糊语音识别结果指示存在唤醒词时,由数字信号处理器唤醒中央处理器,所述中央处理器处于休眠状态;通过中央处理器对所述音频数据进行语义分析,并根据分析结果执行所述分析结果相应的操作。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取音频数据;通过数字信号处理器对所述音频数据进行模糊语音识别;当模糊语音识别结果指示存在唤醒词时,由数字信号处理器唤醒中央处理器,所述中央处理器处于休眠状态;通过中央处理器对所述音频数据进行语义分析,并根据分析结果执行所述分析结果相应的操作。2.根据权利要求1所述的方法,其特征在于,所述通过数字信号处理器对所述音频数据进行模糊语音识别,包括:通过数字信号处理器,采用模糊聚类分析对所述音频数据进行语音识别,得到模糊语音识别结果。3.根据权利要求2所述的方法,其特征在于,所述通过数字信号处理器,采用模糊聚类分析对所述音频数据进行语音识别,得到模糊语音识别结果,包括:根据模糊聚类分析建立模糊聚类神经网络;将所述模糊聚类神经网络作为概率密度函数的估计器,对所述音频数据包含唤醒词的概率进行预测;若预测结果指示概率大于等于设定值,则生成指示存在唤醒词的模糊语音识别结果;若预测结果指示概率小于设定值,则生成指示不存在唤醒词的模糊语音识别结果。4.根据权利要求1所述的方法,其特征在于,所述通过数字信号处理器对所述音频数据进行模糊语音识别,包括:通过数字信号处理器,采用模糊匹配算法对所述音频数据进行语音识别,得到模糊语音识别结果。5.根据权利要求4所述的方法,其特征在于,所述通过数字信号处理器,采用模糊匹配算法对所述音频数据进行语音识别,得到模糊语音识别结果,包括:获取唤醒词读音的特征图,得到标准特征图;分析所述音频数据中各个单词读音的特征图,得到待匹配特征图;根据预设的隶属度函数计算各个待匹配特征图属于标准特征图的程度值;若所述程度值大于等于预设值,则生成指示存在唤醒词的模糊语音识别结果;若所述程度值小于预设值,则生成指示不存在唤醒词的模糊语音识别结果。6.根据权利要求1所述的方法,其特征在于,所述通过中央处理器对所述音频数据进行语义分析之前,还包括:从数字信号处理器中读取所述音频数据中包含唤醒词的数据,得到唤醒数据;通过所述中央处理器对所述唤醒数据进行语音识别;当语音识别结果指示存在唤醒词时,执行通过中央处理器对所述音频数据进行语义分析的步骤;当语音识别结果指示不存在唤醒词时,将中央处理器设置为休眠,并返回执行获取音频数据的步骤。7.根据权利要求6所述的方法,其特征在于,所述通过所述中央处理器对所述唤醒数据进行语音识别,包括:将所述中央处理器的工作状态设置为第一状态,所述第一状态为单核且低...
【专利技术属性】
技术研发人员:唐惠忠,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。