一种基于嵌入式微处理单位非特定对象语音识别方法技术

技术编号:19554081 阅读:14 留言:0更新日期:2018-11-24 22:29
本发明专利技术公开了一种基于嵌入式微处理单位非特定对象语音识别方法,包括以下步骤:S1,音频获取:由录音单元进行录音,获得音频数据;S2,对获得的音频数据进行处理,得到不含静音和长时间停顿的目标语音数据;S3,首先对目标语音数据进行MFCC声学特征处理,得到特征码;然后通过预先加载的语言模型和音素字典,搜索出音素,根据获得的音素,使用向前概率算法组合出音节,然后计算出词组字符串;S4,通过模糊匹配算法,识别语言指令,本发明专利技术的有益效果是:支持语音指令可扩展,数量不受限,语音识别率高,应用领域广泛,在原有的硬件系统就可支持,无需增加额外的语音识别芯片。

A Speech Recognition Method Based on Embedded Microprocessor Unit for Nonspecific Objects

The invention discloses an object-independent speech recognition method based on embedded microprocessor unit, which includes the following steps: S1, audio acquisition: recording by recording unit to obtain audio data; S2, processing the obtained audio data to obtain target speech data without silence and long pause; S3, first of all. The target speech data is processed by MFCC acoustic features, and the feature codes are obtained. Then the phonemes are searched through the pre-loaded language model and phoneme dictionary. According to the obtained phonemes, the syllables are combined by forward probability algorithm, and then the phrase string is calculated. S4, through the fuzzy matching algorithm, the language instructions are recognized. The invention has the advantages of expandable voice instructions, unlimited number, high speech recognition rate and wide application fields, and can be supported in the original hardware system without adding additional speech recognition chips.

【技术实现步骤摘要】
一种基于嵌入式微处理单位非特定对象语音识别方法
本专利技术涉及一种语音识别方法,具体是一种基于嵌入式微处理单位非特定对象语音识别方法。
技术介绍
随着科学技术日新月异的发展与层出不穷的创新,越来越多的新型智能化电子设备不断涌现于世。因其不仅能够实现轻松办公的目的,而且具有简化工作流程,减轻工作负荷,提高工作效率,节省人力成本,操作简便快捷等诸多优越性,因此这些新型智能化电子设备被广泛应用于各行各业,倍受人们关注和青睐,而语音识别设备便是这些新型智能化电子设备之一典型代表。传统的嵌入式微芯片语音识别是针对少数固定语音指令进行语音识别的,语音指令固定不可扩展,语音指令数量少,实际应用上存在局限性,需要特定语音芯片才支持,使用局限性较大。
技术实现思路
本专利技术的目的在于提供一种基于嵌入式微处理单位非特定对象语音识别方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于嵌入式微处理单位非特定对象语音识别方法,包括以下步骤:S1,音频获取:由录音单元进行录音,获得音频数据;S2,对获得的音频数据进行处理,得到不含静音和长时间停顿的目标语音数据;S3,首先对目标语音数据先对语音进行预加重、分帧和加窗,对每一个加窗,通过FFT得到对应的频谱,将得到的频谱通过Mel滤波器组得到Mel频谱,在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC;S4,a)将得到的所有字符串通过三音对照表转换成音节列表;b)提取每个字符串中所有的单个音节;c)使用每个字符串中的单个音节去匹配识别出来的音节,计算命中个数和多音命中率;d)命中率最高且大于10%的即匹配成功。作为本专利技术进一步的方案:步骤S2中,获得目标语音数据的方法为:首先对获得的音频数据进行剪切,对音频数据中静音和长时间停顿的语音数据进行丢弃,即可得到不含静音和长时间停顿的目标语音数据。作为本专利技术再进一步的方案:步骤S3中得到特征码的方法为:首先将目标语音数据转化到梅尔频率,然后将标语音数据进行倒谱分析得到特征码。与现有技术相比,本专利技术的有益效果是:支持语音指令可扩展,数量不受限(硬件存储空间够情况下),语音识别率高,应用领域广泛,在原有的硬件系统就可支持,无需增加额外的语音识别芯片。附图说明图1为实施例1的流程图。图2为实施例2的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1请参阅图1,一种基于嵌入式微处理单位非特定对象语音识别方法,包括以下步骤:S1,由录音单元如麦克风等进行录音,得到不经过处理的原始音频数据;S2,对获得的原始音频数据进行放大处理,并将其切割,得到一组与原始音频数据对应的特征码;S3,将上述所得的特征码与数据库中固定指令的特征码进行比对,得到匹配度;S4,当匹配度达处于数据库中固定指令的设定范围内,即表示语音识别成功。实施例2请参阅图2,在实施例1的基础上,本实施例对识别方法进行了进一步的优化,具体如下:先加载声学模型,后通过LM软件动态生成语言模型和音素字典,再加载语言模型和音素字典,初始化只有首次使用语音识别时调用:S1,音频获取:由录音单元如麦克风等进行录音,获得音频数据;S2,对获得的音频数据进行剪切,对音频数据中静音和长时间停顿的语音数据进行丢弃,这部分语音数据是空白的,在后续的识别过程中不需要,因此将其舍弃,得到目标语音数据;S3,a)首先将目标语音数据先对语音进行预加重、分帧和加窗,对每一个短时分析窗,通过FFT得到对应的频谱,将得到的频谱通过Mel滤波器组得到Mel频谱,在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征(即MFCC),有了此特征码就可以对产生的音素phoneme进行准确的描述;b)通过预先加载的语言模型和音素字典,搜索出可能的音素;c)根据获得的音素,使用向前概率算法组合出音节;d)根据音节计算最佳的词组字符串,通过语言模型里面字符概率数值遍历组合,保留概率最高的字符串;S4,通过模糊匹配算法,精准识别语言指令a)将得到的所有字符串通过三音对照表转换成音节列表;b)提取每个字符串中所有的单个音节;c)使用每个字符串中的单个音节去匹配识别出来的音节,计算命中个数和多音命中率;d)命中率最高且大于10%的即匹配成功。对于本领域技术人员而言,显然本专利技术不限于上述示范性实施例的细节,而且在不背离本专利技术的精神或基本特征的情况下,能够以其他的具体形式实现本专利技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本专利技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本专利技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。本文档来自技高网...

【技术保护点】
1.一种基于嵌入式微处理单位非特定对象语音识别方法,其特征在于,包括以下步骤:S1,音频获取:由录音单元进行录音,获得音频数据;S2,对获得的音频数据进行处理,得到不含静音和长时间停顿的目标语音数据;S3,首先对目标语音数据先对语音进行预加重、分帧和加窗,对每一个加窗,通过FFT得到对应的频谱,将得到的频谱通过Mel滤波器组得到Mel频谱,在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC;S4,a)将得到的所有字符串通过三音对照表转换成音节列表;b)提取每个字符串中所有的单个音节;c)使用每个字符串中的单个音节去匹配识别出来的音节,计算命中个数和多音命中率;d)命中率最高且大于10%的即匹配成功。

【技术特征摘要】
1.一种基于嵌入式微处理单位非特定对象语音识别方法,其特征在于,包括以下步骤:S1,音频获取:由录音单元进行录音,获得音频数据;S2,对获得的音频数据进行处理,得到不含静音和长时间停顿的目标语音数据;S3,首先对目标语音数据先对语音进行预加重、分帧和加窗,对每一个加窗,通过FFT得到对应的频谱,将得到的频谱通过Mel滤波器组得到Mel频谱,在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC;S4,a)将得到的所有字符串通过三音对照表转换成音节列表;b)提取每个字符串中所有的单个音节;c)使用每个字符串中的单...

【专利技术属性】
技术研发人员:胡波
申请(专利权)人:深圳市泰辰达信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1