一种加密语音信号的感知哈希特征提取方法及系统技术方案

技术编号:19829255 阅读:20 留言:0更新日期:2018-12-19 17:07
本发明专利技术公开了一种加密语音信号的感知哈希特征提取方法及系统,该方法包括:对加密语音信号分帧,计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵。将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵。采用非负矩阵分解方法对特征系数矩阵进行分解,得到特征参数矩阵;利用哈希函数对特征参数矩阵进行二进制哈希构造,得到加密语音信号的感知哈希值。采用本发明专利技术的方法或系统可以将从加密语音信号中提取的短时互相关系数作为加密语音信号的感知特征,并通过哈希构造生成加密语音信号的感知哈希值,提高了从加密语音信号中直接提取语音感知特征时的鲁棒性、区分性和摘要性。

【技术实现步骤摘要】
一种加密语音信号的感知哈希特征提取方法及系统
本专利技术涉及语音信号处理技术,尤其涉及一种加密语音信号的感知哈希特征提取方法及系统。
技术介绍
随着计算机网络和多媒体信息技术的飞速发展,多媒体语音是作为传递信息最为直接和方便的多媒体应用之一。为了保证用户语音数据的安全性,语音数据在上传到云服务器之前需要被加密,由于加密处理会导致语音绝大部分感知内容丢失。因此,如何在密文语音中提取能够满足检索、认证等操作的语音特征成为了人们关注且富有挑战性的课题。近年来,国内外研究学者对明文域的语音感知哈希特征的提取方法做了大量研究,如焦玉华等人提出的以语音提取线谱作为感知特征,并通过离散余弦变换(DCT)对参数矩阵去相关来提取最终的感知特征参数,该算法具有良好的鲁棒性,但是摘要性不强。王宏霞等人提出的基于数字水印和感知哈希的密文域语音搜索算法,通过从明文语音中提取过零率,并将生成的感知哈希序列作为搜索摘要。该算法效率较高,但是鲁棒性和区分性不强。Zhao等人提出了一种较为新颖的感知哈希算法用于密文语音检索,利用语音的多重分形特征生成感知哈希摘要,算法具有良好的鲁棒性和区分性,但压缩数据规模之后,算法的鲁棒性和区分性会出现下降,从而导致检索性能的降低。综上所述,现有的用于明文域语音认证、密文语音检索等应用的提取感知哈希特征方法的鲁棒性和区分性不能很好地折中,摘要性也较差,感知特征提取效率也较慢,而且现有研究方法不能直接从加密语音信号中提取感知哈希特征值。
技术实现思路
本专利技术的目的是提供一种加密语音信号的感知哈希特征提取方法及系统,以解决现有技术中从加密语音信号中直接提取语音感知特征时的鲁棒性差、区分性差和摘要性差的问题。一种加密语音信号的感知哈希特征提取方法,包括:获取初始时域语音信号;对所述初始时域语音信号进行置乱加密处理,得到加密语音信号;采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧;根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵;其中,Ri(k)为第i个加密语音帧的短时互相关系数,Pi-1(m)为第i-1个加密语音帧,Pi(m+k)是第i-1个加密语音帧的移位序列,k为延迟量,L为加密语音帧的长度,m={1,2,…,L},i={2,3,…,fn},fn为加密语音帧的总帧数;将互相关系数矩阵每行中的短时互相关系数按从大到小排列;将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,其中1≤N≤fn;采用非负矩阵分解方法对所述特征系数矩阵进行分解,得到特征参数矩阵;利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值。可选的,所述对所述初始时域语音信号进行置乱加密处理,得到加密语音信号,具体包括:对所述初始时域语音信号进行不重叠分帧处理,得到多个初始时域语音分帧信号;所述初始时域语音分帧信号的长度为256;分别对每个所述初始时域语音分帧信号进行一维离散余弦变换,得到多个频域语音分帧信号;利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数,对频域语音分帧信号按随机分配的整数的大小进行排列,得到多个置乱后的频域语音分帧信号,其中1≤所述随机分配的整数的个数≤fn;对多个置乱后的频域语音分帧信号进行离散余弦反变换,得到多个置乱后的时域语音分帧信号;将所述多个置乱后的时域语音分帧信号顺序连接,得到所述加密语音信号。可选的,所述采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧,具体包括:采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧Pn(m)=ω(m)×Xe((n-1)×inc+m);其中,Pn(m)是第n个加密语音帧,1≤n≤fn,ω(m)为窗函数,inc为后一帧对前一帧的位移量,m为加密语音帧的帧内样点数,Xe(.)为加密语音信号。可选的,所述将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,具体包括:将互相关系数矩阵每行中前22个短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,本专利技术中每行选取22个数值,即N=22。可选的,所述利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值,具体包括:利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值;其中,Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值,H1(i)为特征参数矩阵的第i个值,H1(i+1)为特征参数矩阵的第i+1个值。一种加密语音信号的感知哈希特征提取系统,其特征在于,包括:初始时域语音信号获取模块,用于获取初始时域语音信号;加密语音信号生成模块,用于对所述初始时域语音信号进行置乱加密处理,得到加密语音信号;加密语音帧生成模块,用于采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧;互相关系数矩阵生成模块,用于根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵;其中,Ri(k)为第i个加密语音帧的短时互相关系数,Pi-1(m)为第i-1个加密语音帧,Pi(m+k)是第i-1个加密语音帧的移位序列,k为延迟量,L为加密语音帧的长度,m={1,2,…,L},i={2,3,…,fn},fn为加密语音帧的总帧数;排序模块,用于将互相关系数矩阵每行中的短时互相关系数按从大到小排列;特征系数矩阵生成模块,用于将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵;特征参数矩阵生成模块,用于采用非负矩阵分解方法对所述特征系数矩阵进行分解,得到特征参数矩阵;加密语音信号的感知哈希值生成模块,用于利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值。可选的,所述加密语音信号生成模块具体包括:初始时域语音分帧信号生成单元,用于对所述初始时域语音信号进行不重叠分帧处理,得到多个初始时域语音分帧信号;所述初始时域语音分帧信号的长度为256;频域语音分帧信号生成单元,用于分别对每个所述初始时域语音分帧信号进行一维离散余弦变换,得到多个频域语音分帧信号;置乱后的频域语音分帧信号生成单元,用于利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数,对频域语音分帧信号按随机分配的整数的大小进行排列,得到多个置乱后的频域语音分帧信号,其中1≤所述随机分配的整数的个数≤fn;时域语音分帧信号生成单元,用于对多个置乱后的频域语音分帧信号进行离散余弦反变换,得到多个置乱后的时域语音分帧信号;加密语音信号生成单元,用于将所述多个置乱后的时域语音分帧信号顺序连接,得到所述加密语音信号。可选的,所述加密语音帧生成模块得到的多个加密语音帧为Pn(m)=ω(m)×Xe((n-1)×inc+m);其中,Pn(m)是第n个加密语音帧,1≤n≤fn,ω(m)为窗函数,inc为后一帧对前一帧的位移量,m为加密语音帧的帧内样点数,Xe(.)为加密语音信号。可选的,所述特征系数矩阵生成模块生成的特征系数矩阵每行中元的个数为22,即N=22。可选的,所述加密语音信号的感知哈希值生成模块利用的哈希函数为其中,Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值,H1本文档来自技高网...

【技术保护点】
1.一种加密语音信号的感知哈希特征提取方法,其特征在于,包括:获取初始时域语音信号;对所述初始时域语音信号进行置乱加密处理,得到加密语音信号;采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧;根据公式

【技术特征摘要】
1.一种加密语音信号的感知哈希特征提取方法,其特征在于,包括:获取初始时域语音信号;对所述初始时域语音信号进行置乱加密处理,得到加密语音信号;采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧;根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵;其中,Ri(k)为第i个加密语音帧的短时互相关系数,Pi-1(m)为第i-1个加密语音帧,Pi(m+k)是第i-1个加密语音帧的移位序列,k为延迟量,L为加密语音帧的长度,m={1,2,…,L},i={2,3,…,fn},fn为加密语音帧的总帧数;将互相关系数矩阵每行中的短时互相关系数按从大到小排列;将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,其中1≤N≤fn;采用非负矩阵分解方法对所述特征系数矩阵进行分解,得到特征参数矩阵;利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值。2.根据权利要求1所述的方法,其特征在于,所述对所述初始时域语音信号进行置乱加密处理,得到加密语音信号,具体包括:对所述初始时域语音信号进行不重叠分帧处理,得到多个初始时域语音分帧信号;所述初始时域语音分帧信号的长度为256;分别对每个所述初始时域语音分帧信号进行一维离散余弦变换,得到多个频域语音分帧信号;利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数,对频域语音分帧信号按随机分配的整数的大小进行排列,得到多个置乱后的频域语音分帧信号,其中1≤所述随机分配的整数的个数≤fn;对多个置乱后的频域语音分帧信号进行离散余弦反变换,得到多个置乱后的时域语音分帧信号;将所述多个置乱后的时域语音分帧信号顺序连接,得到所述加密语音信号。3.根据权利要求1所述的方法,其特征在于,所述采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧,具体包括:采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧Pn(m)=ω(m)×Xe((n-1)×inc+m);其中,Pn(m)是第n个加密语音帧,1≤n≤fn,ω(m)为窗函数,inc为后一帧对前一帧的位移量,m为加密语音帧的帧内样点数,Xe(.)为加密语音信号。4.根据权利要求1所述的方法,其特征在于,所述将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,具体包括:将互相关系数矩阵每行中前22个短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵。5.根据权利要求1所述的方法,其特征在于,所述利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值,具体包括:利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值;其中,Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值,H1(i)为特征参数矩阵的第i个值,H1(i+1)为特征参数矩阵的第i+...

【专利技术属性】
技术研发人员:张秋余周亮张其文晏燕葛子贤李改莉李昱州张登海
申请(专利权)人:兰州理工大学
类型:发明
国别省市:甘肃,62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1