基于卷积神经网络的语音特征匹配方法组成比例

技术编号:22388969 阅读:23 留言:0更新日期:2019-10-29 06:59
本发明专利技术公开了一种基于卷积神经网络的语音特征匹配方法,包括:S1,预处理,提取音频信号的梅尔谱图,在时域上切割成图像片段,对图像片段做傅里叶变换得到频谱信号;并提取出特征向量;S2,将音频样本的特征向量按照时间顺序排列后进行池化处理形成语音记录文件,并将语音记录文件转换成二值特征序列;S3,语音特征匹配,利用语音查询文件与语音记录文件进行比较,查找出与语音查询文件具有相同内容的语音记录文件。本发明专利技术提高了语音识别的准确率,降低了语音识别系统的复杂性,增强了软件健壮性。

【技术实现步骤摘要】
基于卷积神经网络的语音特征匹配方法
本专利技术涉及语音识别
,更为具体地,涉及一种基于卷积神经网络的语音特征匹配方法。
技术介绍
语音是人们之间交流的重要工具,例如语音电话、语音聊天和语音功能提示等,随着信息化时代的深入发展,近年来语音交互技术受到了广泛的关注。在现有语音处理技术中,例如公开号为CN103236260B的中国专利公开了一种语音识别系统,包括:存储单元,用于存储至少一个用户的语音模型;语音采集及预处理单元,用于采集待识别语音信号,对待识别语音信号进行格式转换及编码;特征提取单元,用于从编码后的待识别语音信号中提取语音特征参数;模式匹配单元,用于将所提取的语音特征参数与至少一个语音模型进行匹配,确定待识别语音信号所属的用户。该系统从语音的产生原理开始分析语音的特性,并使用MFCC参数,建立说话人的语音特征模型,实现说话人的特征识别算法,能够达到提高说话人检测可靠性的目的,使得最终能够在电子产品上实现说话人识别的功能。但是,存在语音识别的准确率较低,语音识别系统的较为复杂,软件运行健壮性较差等问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供了一种基于卷积神经网络的语音特征匹配方法,提高了语音识别的准确率,降低了语音识别系统的复杂性,增强了软件健壮性。本专利技术的目的是通过以下技术方案来实现的:一种基于卷积神经网络的语音特征匹配方法,包括:S1,预处理,提取音频信号的梅尔谱图,在时域上切割成图像片段,对所述图像片段做傅里叶变换得到频谱信号;并提取出特征向量;S2,将音频样本的特征向量按照时间顺序排列后进行池化处理形成语音记录文件,并将语音记录文件转换成二值特征序列;S3,语音特征匹配,利用语音查询文件与所述语音记录文件进行比较,查找出与语音查询文件具有相同内容的语音记录文件;S4,对匹配的语音记录文件进行分类处理后,解码转换为文本信息,并匹配识别相应的情感分类模板,在完成情感匹配识别后,通过输出设备输出匹配结果内容。进一步的,在步骤S1中,采用PCA白化降低频谱的维度。进一步的,在步骤S2中,包括如下步骤:S21,将同一个音频样本的所有特征向量按时间顺序排列;S22,将排列好的特征向量分成多等份,对每一等份进行池化,然后将所有向量拼起来;S23,对拼接后的向量再一次池化处理,得到全局特征并形成语音记录文件。进一步的,在步骤S3中,包括如下步骤:S31,定义欧氏距离函数,然后建立最小欧式距离的索引;S32,计算特征向量的欧氏距离并与索引关联的最小欧式距离比较,得到第一距离差值匹配结果,然后计算第二欧式距离并与索引关联的最小欧式距离比较,得到第一距离差值匹配结果,循环计算直到检索到距离差值匹配结果最小值;S33,将距离差值匹配结果最小值对应的特征向量作为匹配正确的语音记录文件。进一步的,在步骤S4中,采用SVM算法对匹配的语音记录文件加以分类。本专利技术的有益效果是:(1)本专利技术提高了语音识别的准确率,降低了语音识别系统的复杂性,增强了软件健壮性。具体而言,本专利技术形成语音记录文件,提高了特征提取效率,通过建立距离函数索引,快速匹配正确的语音记录文件,提高了匹配效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的步骤流程示意图。具体实施方式下面结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。本说明书中公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。下面将详细描述本专利技术的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本专利技术。在以下描述中,为了提供对本专利技术的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本专利技术。在其他实例中,为了避免混淆本专利技术,未具体描述公知的电路,软件或方法。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在对实施例进行描述之前,需要对一些必要的术语进行解释。例如:若本申请中出现使用“第一”、“第二”等术语来描述各种元件,但是这些元件不应当由这些术语所限制。这些术语仅用来区分一个元件和另一个元件。因此,下文所讨论的“第一”元件也可以被称为“第二”元件而不偏离本专利技术的教导。应当理解的是,若提及一元件“连接”或者“联接”到另一元件时,其可以直接地连接或直接地联接到另一元件或者也可以存在中间元件。相反地,当提及一元件“直接地连接”或“直接地联接”到另一元件时,则不存在中间元件。在本申请中出现的各种术语仅仅用于描述具体的实施方式的目的而无意作为对本专利技术的限定,除非上下文另外清楚地指出,否则单数形式意图也包括复数形式。当在本说明书中使用术语“包括”和/或“包括有”时,这些术语指明了所述特征、整体、步骤、操作、元件和/或部件的存在,但是也不排除一个以上其他特征、整体、步骤、操作、元件、部件和/或其群组的存在和/或附加。如图1所示,一种基于卷积神经网络的语音特征匹配方法,包括:S1,预处理,提取音频信号的梅尔谱图,在时域上切割成图像片段,对所述图像片段做傅里叶变换得到频谱信号;并提取出特征向量;S2,将音频样本的特征向量按照时间顺序排列后进行池化处理形成语音记录文件,并将语音记录文件转换成二值特征序列;S3,语音特征匹配,利用语音查询文件与所述语音记录文件进行比较,查找出与语音查询文件具有相同内容的语音记录文件;S4,对匹配的语音记录文件进行分类处理后,解码转换为文本信息,并匹配识别相应的情感分类模板,在完成情感匹配识别后,通过输出设备输出匹配结果内容。进一步的,在步骤S1中,采用PCA白化降低频谱的维度。进一步的,在步骤S2中,包括如下步骤:S21,将同一个音频样本的所有特征向量按时间顺序排列;S22,将排列好的特征向量分成多等份,对每一等份进行池化,然后将所有向量拼起来;S23,对拼接后的向量再一次池化处理,得到全局特征并形成语音记录文件。进一步的,在步骤S3中,包括如下步骤:S31,定义欧氏距离函数,然后建立最小欧式距离的索引;S32,计算特征向量的欧氏距离并与索引关联的最小欧式距离比较,得到第一距离差值匹配结果,然后计算第二欧式距离并与索引关联的最小欧式距离比较,得到第一距离差值匹配结果,循环计算直到检索到距离差值匹配结果最小值;S33,将距离差值匹配结果最小值对应的特征向量作为匹配正确的语音记录文件。进一步的,在步骤S4中,采用SVM算法对匹配的语音记录文件加以分类。实施例1如图1所示,一本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的语音特征匹配方法,其特征在于,包括:S1,预处理,提取音频信号的梅尔谱图,在时域上切割成图像片段,对所述图像片段做傅里叶变换得到频谱信号;并提取出特征向量;S2,将音频样本的特征向量按照时间顺序排列后进行池化处理形成语音记录文件,并将语音记录文件转换成二值特征序列;S3,语音特征匹配,利用语音查询文件与所述语音记录文件进行比较,查找出与语音查询文件具有相同内容的语音记录文件;S4,对匹配的语音记录文件进行分类处理后,解码转换为文本信息,并匹配识别相应的情感分类模板,在完成情感匹配识别后,通过输出设备输出匹配结果内容。

【技术特征摘要】
1.一种基于卷积神经网络的语音特征匹配方法,其特征在于,包括:S1,预处理,提取音频信号的梅尔谱图,在时域上切割成图像片段,对所述图像片段做傅里叶变换得到频谱信号;并提取出特征向量;S2,将音频样本的特征向量按照时间顺序排列后进行池化处理形成语音记录文件,并将语音记录文件转换成二值特征序列;S3,语音特征匹配,利用语音查询文件与所述语音记录文件进行比较,查找出与语音查询文件具有相同内容的语音记录文件;S4,对匹配的语音记录文件进行分类处理后,解码转换为文本信息,并匹配识别相应的情感分类模板,在完成情感匹配识别后,通过输出设备输出匹配结果内容。2.根据权利要求1所述的基于卷积神经网络的语音特征匹配方法,其特征在于,在步骤S1中,采用PCA白化降低频谱的维度。3.根据权利要求1所述的基于卷积神经网络的语音特征匹配方法,其特征在于,在步骤S2中,包括如下步骤:S...

【专利技术属性】
技术研发人员:李剑峰
申请(专利权)人:湖南检信智能科技有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1