一种基于快速傅里叶逆变换的语音检索方法及系统技术方案

技术编号:21714578 阅读:223 留言:0更新日期:2019-07-27 19:15
本发明专利技术公开了一种基于快速傅里叶逆变换的语音检索方法及系统。所述方法包括:获取待查询语音;采用快速傅里叶逆变换对待查询语音进行特征提取,得到待查询特征向量;采用测量矩阵对待查询特征向量进行降维,得到降维后的待查询特征向量;依据降维后的待查询特征向量构建待查询哈希序列;将待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;依据匹配哈希序列和密文语音库,确定检索语音文件;系统哈希索引表与密文语音库均存储于云服务器中。本发明专利技术将快速傅里叶逆变换与测量矩阵相结合,能够高效提取具有良好鲁棒性和区分性的语音特征,且提高了检索效率和检索准确率。

A Speech Retrieval Method and System Based on Fast Fourier Inverse Transform

【技术实现步骤摘要】
一种基于快速傅里叶逆变换的语音检索方法及系统
本专利技术涉及语音检索
,特别是涉及一种基于快速傅里叶逆变换的语音检索方法及系统。
技术介绍
随着互联网技术的迅猛发展,多媒体海量信息应运而生,尤其是语音这种非结构化的数据则呈指数型的增长。如何在海量语音信息中检索数据、如何在保证海量语音信息安全的前提下高效并准确检索数据等问题是现在语音检索领域所面对的重要挑战。目前,语音检索技术已有诸多研究成果。该技术主要分为:基于文本或关键字检索、基于内容检索。而基于内容的语音检索又可分为:特征匹配、深度学习、排序检索等。特征提取是语音检索的重要步骤,特征提取主要有以下方法:感知哈希、音频指纹等。基于内容的密文语音检索算法既能够保障语音数据的隐私安全又能够高效并准确的检索数据,因此,基于内容的密文语音检索算法的研究具有非常重要的理论和应用价值。国内外诸多研究机构及学者已经在基于内容的密文语音检索方面取得了诸多研究成果。现有基于内容的密文语音检索存在以下缺点:在语音特征提取方面,现有算法由于鲁棒性、区分性及算法效率三者相互约束,还不能够很好的权衡好三者;对于语音加密算法,大多数算法会使得语音丢失的部分特征,严重影响后续的检索效果,而复杂度高的加密算法又将导致检索算法效率低下,不能同时具备优秀的检索效率及精确度,现有算法在这两方面还有待提高;另外,对于语音感知哈希序列的存储,现有方法都是将提取的感知哈希序列利用数字水印嵌入到密文语音中,起到了一定的认证作用,但同时也会影响检索效率,降低检索精度。
技术实现思路
基于此,有必要提供一种基于快速傅里叶逆变换的语音检索方法及系统,以实现高效提取具有良好鲁棒性和区分性的语音特征,以及解决检索效率低、准确率低的问题。为实现上述目的,本专利技术提供了如下方案:一种基于快速傅里叶逆变换的语音检索方法,包括:获取待查询语音;采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量;采用测量矩阵对所述待查询特征向量进行降维,得到降维后的待查询特征向量;依据所述降维后的待查询特征向量构建待查询哈希序列;将所述待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;所述匹配哈希序列为所述系统哈希索引表中与所述待查询哈希序列相匹配的哈希序列;依据所述匹配哈希序列和密文语音库,确定检索语音文件;所述系统哈希索引表与所述密文语音库均存储于云服务器中。可选的,所述系统哈希索引表的确定方法为:获取原始语音文件;所述原始语音文件由多条语音片段构成;采用快速傅里叶逆变换对所述原始语音文件进行特征提取,得到原文件特征向量;采用测量矩阵对所述原文件特征向量进行降维,得到降维后的原文件特征向量;依据所述降维后的原文件特征向量构建二进制哈希序列集;所述二进制哈希序列集包括多个二进制哈希序列;每个所述二进制哈希序列对应一条语音片段;对所述二进制哈希序列集中的二进制哈希序列进行分类,确定每个所述二进制哈希序列的分类类标;将分类类标相同的二进制哈希序列确定为一个分类类型组;对所述分类类型组进行无损压缩,生成系统哈希索引表,并上传至云服务器。可选的,所述密文语音库的确定方法为:在获取原始语音文件之后,采用Henon混沌置乱加密算法对所述原始语音文件进行加密,得到密文语音文件;将所述密文语音文件上传至所述云服务器,形成密文语音库。可选的,在所述采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量之前,还包括:对所述待查询语音进行预加重处理;对处理后待查询语音依次进行分帧和加窗处理。可选的,所述将所述待查询哈希序列与所述系统哈希索引表进行匹配,确定匹配哈希序列,具体包括:确定第一分类类标;所述第一分类类标为所述待查询哈希序列的分类类标;将所述系统哈希索引表中分类类标与所述第一分类类标相同的分类类型组确定为匹配二进制哈希序列组;计算所述待查询哈希序列与所述匹配二进制哈希序列组中每个二进制哈希序列之间的归一化汉明距离;将小于或等于预设阈值的归一化汉明距离对应的二进制哈希序列确定为匹配哈希序列。可选的,所述依据所述匹配哈希序列和密文语音库,确定检索语音文件,具体包括:在所述密文语音库中查找与所述匹配哈希序列对应的语音文件,得到检索密文语音;对所述检索密文语音进行解密,得到检索语音文件。本专利技术还提供了一种基于快速傅里叶逆变换的语音检索系统,包括:第一语音获取模块,用于获取待查询语音;第一特征提取模块,用于采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量;第一降维模块,用于采用测量矩阵对所述待查询特征向量进行降维,得到降维后的待查询特征向量;第一序列构建模块,用于依据所述降维后的待查询特征向量构建待查询哈希序列;匹配模块,用于将所述待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;所述匹配哈希序列为所述系统哈希索引表中与所述待查询哈希序列相匹配的哈希序列;检索语音确定模块,用于依据所述匹配哈希序列和密文语音库,确定检索语音文件;所述系统哈希索引表与所述密文语音库均存储于云服务器中。可选的,所述语音检索系统还包括:第二语音获取模块,用于获取原始语音文件;所述原始语音文件由多条语音片段构成;第二特征提取模块,用于采用快速傅里叶逆变换对所述原始语音文件进行特征提取,得到原文件特征向量;第二降维模块,用于采用测量矩阵对所述原文件特征向量进行降维,得到降维后的原文件特征向量;序列集构建模块,用于依据所述降维后的原文件特征向量构建二进制哈希序列集;所述二进制哈希序列集包括多个二进制哈希序列;每个所述二进制哈希序列对应一条语音片段;分类模块,用于对所述二进制哈希序列集中的二进制哈希序列进行分类,确定每个所述二进制哈希序列的分类类标;类型组确定模块,用于将分类类标相同的二进制哈希序列确定为一个分类类型组;索引表生成模块,用于对所述分类类型组进行无损压缩,生成系统哈希索引表,并上传至云服务器。可选的,所述语音检索系统还包括:加密模块,用于在获取原始语音文件之后,采用Henon混沌置乱加密算法对所述原始语音文件进行加密,得到密文语音文件;密文库构建模块,用于将所述密文语音文件上传至所述云服务器,形成密文语音库。可选的,所述语音检索系统还包括:预处理模块,用于对所述待查询语音进行预加重处理;分帧加窗处理模块,用于对处理后待查询语音依次进行分帧和加窗处理。与现有技术相比,本专利技术的有益效果是:本专利技术提出了一种基于快速傅里叶逆变换的语音检索方法及系统。所述方法包括:采用快速傅里叶逆变换(IFFT)对待查询语音进行特征提取,得到待查询特征向量;采用测量矩阵(MM)对待查询特征向量进行降维,得到降维后的待查询特征向量;依据降维后的待查询特征向量构建待查询哈希序列;将待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;依据匹配哈希序列和密文语音库,确定检索语音文件。本专利技术将快速傅里叶逆变换与测量矩阵相结合,能够高效提取具有良好鲁棒性和区分性的语音特征,且无需将哈希序列作为数字水印嵌入到密文语音中;在检索过程中无需下载和解密,具有较高的检索效率和检索精度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一本文档来自技高网...

【技术保护点】
1.一种基于快速傅里叶逆变换的语音检索方法,其特征在于,包括:获取待查询语音;采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量;采用测量矩阵对所述待查询特征向量进行降维,得到降维后的待查询特征向量;依据所述降维后的待查询特征向量构建待查询哈希序列;将所述待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;所述匹配哈希序列为所述系统哈希索引表中与所述待查询哈希序列相匹配的哈希序列;依据所述匹配哈希序列和密文语音库,确定检索语音文件;所述系统哈希索引表与所述密文语音库均存储于云服务器中。

【技术特征摘要】
1.一种基于快速傅里叶逆变换的语音检索方法,其特征在于,包括:获取待查询语音;采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量;采用测量矩阵对所述待查询特征向量进行降维,得到降维后的待查询特征向量;依据所述降维后的待查询特征向量构建待查询哈希序列;将所述待查询哈希序列与系统哈希索引表进行匹配,确定匹配哈希序列;所述匹配哈希序列为所述系统哈希索引表中与所述待查询哈希序列相匹配的哈希序列;依据所述匹配哈希序列和密文语音库,确定检索语音文件;所述系统哈希索引表与所述密文语音库均存储于云服务器中。2.根据权利要求1所述的一种基于快速傅里叶逆变换的语音检索方法,其特征在于,所述系统哈希索引表的确定方法为:获取原始语音文件;所述原始语音文件由多条语音片段构成;采用快速傅里叶逆变换对所述原始语音文件进行特征提取,得到原文件特征向量;采用测量矩阵对所述原文件特征向量进行降维,得到降维后的原文件特征向量;依据所述降维后的原文件特征向量构建二进制哈希序列集;所述二进制哈希序列集包括多个二进制哈希序列;每个所述二进制哈希序列对应一条语音片段;对所述二进制哈希序列集中的二进制哈希序列进行分类,确定每个所述二进制哈希序列的分类类标;将分类类标相同的二进制哈希序列确定为一个分类类型组;对所述分类类型组进行无损压缩,生成系统哈希索引表,并上传至云服务器。3.根据权利要求2所述的一种基于快速傅里叶逆变换的语音检索方法,其特征在于,所述密文语音库的确定方法为:在获取原始语音文件之后,采用Henon混沌置乱加密算法对所述原始语音文件进行加密,得到密文语音文件;将所述密文语音文件上传至所述云服务器,形成密文语音库。4.根据权利要求1所述的一种基于快速傅里叶逆变换的语音检索方法,其特征在于,在所述采用快速傅里叶逆变换对所述待查询语音进行特征提取,得到待查询特征向量之前,还包括:对所述待查询语音进行预加重处理;对处理后待查询语音依次进行分帧和加窗处理。5.根据权利要求2所述的一种基于快速傅里叶逆变换的语音检索方法,其特征在于,所述将所述待查询哈希序列与所述系统哈希索引表进行匹配,确定匹配哈希序列,具体包括:确定第一分类类标;所述第一分类类标为所述待查询哈希序列的分类类标;将所述系统哈希索引表中分类类标与所述第一分类类标相同的分类类型组确定为匹配二进制哈希序列组;计算所述待查询哈希序列与所述匹配二进制哈希序列组中每个二进制哈希序列之间的归一化汉明距离;将小于或等于预设阈值的归一化汉明距离对应的二进制哈希序列确定为匹配哈...

【专利技术属性】
技术研发人员:张秋余葛子贤胡颖杰张其文李昱洲赵雪娇白建许福久
申请(专利权)人:兰州理工大学
类型:发明
国别省市:甘肃,62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1