一种大数据并行化声纹认证方法技术

技术编号:14146551 阅读:91 留言:0更新日期:2016-12-11 02:54
本发明专利技术公开了一种大数据并行化声纹认证方法,包括以下步骤:收集语音文件,并对收集的语音文件进行分片,存储在分布式计算集群的节点中;对收集的语音文件并行化声纹特征提取,并将提取的声纹特征进行哈希运行,将声纹特征存储到相应的计算集群的节点中,形成声纹特征库;当接收到声纹认证请求时,提取声纹特征,计算待认证声音的声纹与声纹特征库中的声纹之间的距离,建立全局距离模型,根据各个节点中的声纹特征数据,计算待认证声纹特征与声纹特征库中声纹特征的相似度;整理相似度结果,并反馈。本发明专利技术可以实现对声纹库的动态、批量加载与特征提取,同时基于大数据框架实现声纹相似度计算与认证的并行化。

【技术实现步骤摘要】

本专利技术属于生物识别
,具体涉及一种大数据并行化声纹认证方法
技术介绍
声纹识别(Voiceprint Recognize)是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。声纹识别的应用范围较为广泛,涉及生活中的各个方面,如信息领域,银行、证券,公安司法,军队和国防以及,保安和证件防伪。在音频信号处理与语音处理中,线性预测编码(LPC)可以根据线性预测模型的信息用压缩形式表示数字语音信号,能够提供非常精确的语音参数预测。传统的声纹认证技术在处理少量声纹信息时可以保证认证过程的效率,然后面向海量声纹信息以及声纹库时,缺乏高效、可扩展的并行化支持,存在认证效率低、响应时间长、可扩展性差等不足。
技术实现思路
本专利技术针对海量声纹库情况下声纹信息加载时间过长、无法实时响应声纹认证请求问题,公开了一种大数据并行化声纹认证方法。通过本专利技术可以实现对声纹库的动态、批量加载与特征提取,同时基于大数据框架实现声纹相似度计算与认证的并行化。为了实现上述目的,本专利技术采用的技术方案为:一种大数据并行化声纹认证方法,包括以下步骤:S1.收集语音文件,并对收集的语音文件进行分片,存储在分布式计算集群的节点中;S2.对收集的语音文件并行化声纹特征提取,并将提取的声纹特征进行哈希运行,将声纹特征存储到相应的计算集群的节点中,形成声纹特征库;S3.当接收到声纹认证请求时,提取待认证声音的声纹特征,计算待认证声音的声纹与声纹特征库中的声纹之间的距离,建立全局距离模型,根据各个节点中的声纹特征数据,计算待认证声纹特征与声纹特征库中声纹特征的相似度;S4.整理相似度结果,汇聚成相似度结果列表,进行结构筛选并反馈。优选地,步骤S1中,首先建立语音文件存储模块和声纹特征存储模块,然后收集语音文件,并将收集的语音文件进行分片,存储在分布式计算集群的节点中。优选地,步骤S2中,在进行声纹特征提取前,对收集的语音文件进行分帧处理,每个语音文件分帧处理后形成多个短时的分析帧;在进行声纹特征提取前,首先对分析帧进行加窗处理,Hamming Window函数定义为(N为窗口大小): H W ( n ) = α - β c o s ( 2 π n N - 1 ) , α - 0.54 , β = 1 - α = 0.46 ; ]]>设V为单个语音文件声纹数组,Vi为单个语音分析帧声纹数组,则Vi-HW表示加窗后的语音分析帧,针对每个加窗后分析帧运用并行化线性预测编码算法,提取描述声音分析帧特征的二维数组,两个维度分别为LPC系数和误差系数,该二维数组包含描述声音样本特征的关键参数;针对单个语言分析帧的声纹特征提取公式为:[LCi,ECi]=LPC(Vi-HW);LCi与ECi分别是维度为d的特征系数和误差系数,整个声音文件V,声纹特征Feature的维度为d,则 F e a t u r e [ j ] = Σ i = 1 n LC i [ j ] ; ]]>将计算过程广播到集群中的包含数据分片的计算节点,设Ni为计算集群中的节点,则针对每个计算节点的声纹特征提取计算过程可以表示为:Result=Feature[V,Ni];通过对提取的声纹特征进行哈希运算,将声纹特征存储到相应的节点,设M为集群中计算节点个数,则计算声纹特征存储节点的公式为:N=Hash(Result)%M+1。优选地,步骤S3中,提取待认证声音的声纹特征后,将提取的声纹特征和认证配置参数进行封装和序列化,然后广播到集群中存储有声纹特征库的各个计算节点中;在各个节点中,计算待认证声纹与声纹特征库中声纹之间的欧几里得距离,设待认证声纹特征为feature(x1,x2,x3,...),声纹库中声纹特征为feature(y1,y2,y3,...),则欧几里得距离计算公式为: D ( X , Y ) = ( x 2 - y 2 ) 2 + ( x 2 - y 2 ) 2 + ... + ( x n - y n ) 2 = Σ i = 1 n ( x i - y i ) 2 . ]]>优选地,步骤S3中,全局本文档来自技高网...
一种大数据并行化声纹认证方法

【技术保护点】
一种大数据并行化声纹认证方法,其特征在于,包括以下步骤:S1.收集语音文件,并对收集的语音文件进行分片,存储在分布式计算集群的节点中;S2.对收集的语音文件并行化声纹特征提取,并将提取的声纹特征进行哈希运行,将声纹特征存储到相应的计算集群的节点中,形成声纹特征库;S3.当接收到声纹认证请求时,提取待认证声音的声纹特征,计算待认证声音的声纹与声纹特征库中的声纹之间的距离,建立全局距离模型,根据各个节点中的声纹特征数据,计算待认证声纹特征与声纹特征库中声纹特征的相似度;S4.整理相似度结果,汇聚成相似度结果列表,进行结构筛选并反馈。

【技术特征摘要】
1.一种大数据并行化声纹认证方法,其特征在于,包括以下步骤:S1.收集语音文件,并对收集的语音文件进行分片,存储在分布式计算集群的节点中;S2.对收集的语音文件并行化声纹特征提取,并将提取的声纹特征进行哈希运行,将声纹特征存储到相应的计算集群的节点中,形成声纹特征库;S3.当接收到声纹认证请求时,提取待认证声音的声纹特征,计算待认证声音的声纹与声纹特征库中的声纹之间的距离,建立全局距离模型,根据各个节点中的声纹特征数据,计算待认证声纹特征与声纹特征库中声纹特征的相似度;S4.整理相似度结果,汇聚成相似度结果列表,进行结构筛选并反馈。2.根据权利要求1所述的大数据并行化声纹认证方法,其特征在于,步骤S1中,首先建立语音文件存储模块和声纹特征存储模块,然后收集语音文件,并将收集的语音文件进行分片,存储在分布式计算集群的节点中。3.根据权利安全1所述的大数据并行化声纹认证方法,其特征在于,步骤S2中,在进行声纹特征提取前,对收集的语音文件进行分帧处理,每个语音文件分帧处理后形成多个短时的分析帧;在进行声纹特征提取前,首先对分析帧进行加窗处理,Hamming Window函数定义为(N为窗口大小): H W ( n ) = α - β c o s ( 2 π n N - 1 ) , α - 0.54 , β = 1 - α = 0.46 ; ]]>设V为单个语音文件声纹数组,Vi为单个语音分析帧声纹数组,则Vi-HW表示加窗后的语音分析帧,针对每个加窗后分析帧运用并行化线性预测编码算法,提取描述声音分析帧特征的二维数组,两个维度分别为LPC系数和误差系数,该二维数组包含描述声音样本特征的关键参数;针对单个语言分析帧的声纹特征提取公式为:[LCi,ECi]=LPC(Vi-HW);LCi与ECi分别是维度为d的特征系数和误差系数,整个声音文件V,声纹特征Feature的维度为d,则 F e a t u r e [ j ] = Σ i = 1 n LC i [ j ] ; ]]>将计算过程广播到集群中的包含数据分片的计算节点,设Ni为计算集群中的节点,则针对每个计算节点的声纹特征提取计算过程可以表示为:Result=Feature[V,Ni];通过对提取的声纹特征进行哈希运算,将声纹特征存储到相应的节点,设M为集群中计算节点个数,则计算声纹特征存储节点的公式为:N=Hash(Result)%M+1。4.根据权利要求1所述的大数据并行化声纹认证方法,其特征在于,步骤S3中,提取待认证声音的声纹特征后,将提取的声纹特征和认证配置参数进行封装和序列化,然后广播到集群中存储有声纹特征库的各个计算节点...

【专利技术属性】
技术研发人员:彭倍李有福刘静
申请(专利权)人:四川阿泰因机器人智能装备有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1