一种通过声纹引擎检测人声或机器音进行身份核验的方法技术

技术编号：22566725 阅读：60 留言：0更新日期：2019-11-16 12:45

本发明专利技术公开了一种通过声纹引擎检测人声或机器音进行身份核验的方法，包括以下步骤：A、接收待验证音频；B、对接收的音频信息进行预处理；预处理包含以下步骤：a)时长检测；b)静音检测；c)预加重；d)分帧加窗；C、进行声纹比对，判断身份信息，本发明专利技术通过声纹引擎的方式检测人声或机器音进行身份核验。其中该声纹引擎能够高效、快速、准确的识别检测声音是说话人实时表达，还是通过音频播放器播放的录音，并且判断出该声音是否是本人，从而使得声纹识别的应用场景中具有更高的准确率与效率，具有广阔的应用场景。

A method of identity verification by detecting human voice or machine voice with voiceprint engine

The invention discloses a method for identity verification by detecting human voice or machine voice through voiceprint engine, which includes the following steps: A. receiving the audio to be verified; B. preprocessing the received audio information; the preprocessing includes the following steps: a) time length detection; b) silence detection; c) pre emphasis; D) framing plus window; C. comparing voice patterns to determine identity information. The invention adopts Voiceprint engine is used to detect human voice or machine voice for identity verification. Among them, the voiceprint engine can effectively, quickly and accurately identify and detect whether the voice is the real-time expression of the speaker or the recording played by the audio player, and judge whether the voice is the voice itself, so that the application scene of voiceprint recognition has higher accuracy and efficiency, and has a wide range of application scenarios.

全部详细技术资料下载

【技术实现步骤摘要】
一种通过声纹引擎检测人声或机器音进行身份核验的方法
本专利技术涉及身份识别
，具体是一种通过声纹引擎检测人声或机器音进行身份核验的方法。
技术介绍
声纹识别的理论基础是每一个声音都具有独特的特征，从而能将不同人的声音进行有效的区分。这个独特的特征主要包括两方面内容：1、声腔的尺寸；具体包括咽喉、鼻腔和口腔等，这些器官的形状、尺寸和位置决定了声带张力的大小和声音频率的范围。因此不同的人虽然说同样的话，但是声音的频率分布是不同的，听起来有的低沉有的洪亮。每个人的发声腔都是不同的，就像指纹一样，每个人的声音也就有独特的特征。2、发声器官被操纵的方式，发声器官包括唇、齿、舌、软腭及腭肌肉等，他们之间相互作用就会产生清晰的语音。而他们之间的协作方式是人通过后天与周围人的交流中随机学习到的。人在学习说话的过程中，通过模拟周围不同人的说话方式，就会逐渐形成自己的声纹特征。声纹识别技术最早由贝尔实验室开发，主要用于军事情报领域。随着该项技术的逐步发展，60年代末后期在美国的法医鉴定、法庭证据等领域都使用了该项技术，从1967年到现在，美国至少5000多个案件包括谋杀、强奸、敲诈勒索、走私毒品、赌博，政治腐败等都通过声纹识别技术提供了有效的线索和有力的证据。特别强调的是，声纹鉴别目前已经是公安部的标准，是可以作为证据进行鉴定的。声纹识别是个宽泛的概念，技术方面有分为两类：即说话人确认技术和说话人辨认技术，说话人确认技术是用于判断未知说话人是否为某个指定人；后者则是用于辨认未知说话人是已记录说话人中的哪一位。>我们通常理解的都是说话人辨认技术，常常应用于刑侦破案、罪犯跟踪、国防监听、个性化应用等等，说话人确认技术常常应用于证券交易、银行交易、公安取证、个人电脑声控锁、汽车声控锁、身份证、信用卡的识别等。目前来看，声纹识别常用的方法包括模板匹配法、最近邻方法、神经元网络方法，VQ聚类法等。这些方法虽然处理手段不同，但基本原理是类似的，比如刚开始给大家展示的语谱图。语谱图是声音信号的一种图像化的表示方式，它的横轴代表时间，纵轴代表频率，语音在各个频率点的幅值大小用颜色来区分。说话人的声音的基频及谐频在语谱图上表现为一条一条的亮线，再通过不同的处理手段就可以得到不同语谱图之间的相似度，最终达到声纹识别的目的。声纹识别的说话人确认技术在保证现代人们日常信息、财产安全中起着举足轻重的作用，例如，在信用卡、银行交易、系统登录过程中都能够使用声纹识别技术来保证登录人的财产、信息的安全。此外，在公司日常考勤，远程身份确认都有具体的应用。但是目前在这些身份确认过程中，都存在使用录音的方式进行身份验证，从而导致了系统漏洞，严重影响系统的可靠性。如果没有良好的管控，声纹识别说话人确认功能也将成为一种摆设。此外，针对机器音的识别，在某些支付行业，通过提取背景音，采用二次辅助验证的方式来判断是否存在机器音，该种方式在一定程度上，防止了用户直接使用录音的方式来防止录音的可能性。但采用该种依靠背景音来二次验证的方式，不仅增加了用户验证的复杂度，而且并不能直接判断出是否存在录音，并且，用户背景音可能前一秒跟下一秒发生显著性变化，从而造成识别失败。而且，通常在验证过程中实时性要求相对较高，要求程序有快速的响应速度。因此，需要一种能够检测人声或机器音的技术，从而使得声纹识别说话人确认功能能够更加准确无误的完成说话人确认。
技术实现思路
本专利技术的目的在于提供一种通过声纹引擎检测人声或机器音进行身份核验的方法，以解决上述
技术介绍
中提出的问题。为实现上述目的，本专利技术提供如下技术方案：一种通过声纹引擎检测人声或机器音进行身份核验的方法，包括以下步骤：A、接收待验证音频；B、对接收的音频信息进行预处理；预处理包含以下步骤：a)时长检测；b)静音检测；c)预加重；d)分帧加窗；C、进行声纹比对，判断身份信息。作为本专利技术的进一步技术方案：所述步骤a)具体是：根据传入语音，判断语音时长是否满足设定检测时长要求，不满足时长要求的，直接返回错误信息。作为本专利技术的进一步技术方案：所述步骤b)具体是：检测传入语音的分贝值是否大于设定阈值，当所有音频点分贝值都小于设定阈值时，返回错误信息。作为本专利技术的进一步技术方案：所述步骤c)通过一个高通滤波器来实现，其传输函数为：H(z)＝1-μz-1。其中，z表示时间节点，H(z)表示对时刻z加重结果。作为本专利技术的进一步技术方案：所述步骤d)利用可以移动的规定长度的窗口函数的加权实现，以Hamming窗作为窗函数，函数表达式为：其中，N)表]示窗口长度，(n为其中)取的折点数，w(x)表示选定窗口长度对呀折点n的幅度。作为本专利技术的进一步技术方案：当声纹引擎打开了是否检测机器音功能开关时候，声纹引擎在对接收到的音频预处理完成后会异步对比进行声纹比对和是否是机器音验证两个步骤，其中异步对比就使用多线程的方式同时进行上述两个步骤，当声纹引擎打开了是否检测机器音功能开关时候，采用异步方式，分别从声纹模型数据库中获取语音样本特征模型，并提取语音特征向量；以及获取噪声特征模型，并提取噪声的最优分类面。作为本专利技术的进一步技术方案：所述声纹验证具体是：进行说话人比对过程中，首先声纹引擎对经过预处理的接收到的音频进行声纹特征提取操作，然后通过模式匹配的方式来验证声纹引擎接收到的待检测音频和样本语音模型是否为同一个人，通过应用概率最大化匹配算法来实现模式匹配，识别函数如下：其中，n*为识别出的说话人，N表示说话人的，λn为第n个说话人的GMM模型，z表示观察矢量。通过对待识别的语音信号提取出的特征参数，将其与声纹模型特征向量进行特征概率匹配，匹配概率最大的身份即为识别结果。作为本专利技术的进一步技术方案：进行机器音检测过程中，首先会对经过预处理的接收到的音频进行提取信道模式噪声，然后通过使用Legendre多项式系数和提取统计特征值的方式提取待验证音频的长时特征矢量，最后通过SVM分类识别的方法，判断出待检测音频是否为机器音，Legendre多项式的拟合表达式如下：其中Ln为Legendre多项式系数，Pn为勒让德多项式，其定义如下，由于设备产生的信道噪声随着语音信号的存在而存在且变换非常缓慢，采用统计特征值来表示设备产生的信道噪声的统计帧特征信息，最终，通过采用以上两种信道模式噪声的特征值作为判断是否为回放语音的特征矢量，从而完成长时特征矢量的提取，SVM分类识别的方法是根据SVM分类函数，将声纹模型数据库中提取出的噪声最优分类面，与提取的待验证音频的长时特征参数进行分类识别。与现有技术相比，本专利技术具有以下有益效果：本专利技术通过声纹引擎的方式检测人声或机器音进行身份核验。其中该声纹引擎能够高效、快速、准确的识别检测声音是说话人实时表达，还是通过音频播放器播放的录音，并且判断出该声音是否是本人，从而使得声纹识别的应用场景中具有更高的准确率与效率，具有广阔的应用场景。附图说明图1为声纹引擎识别流程图。图2为预处理流程本文档来自技高网...

【技术保护点】
1.一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，包括以下步骤：/nA、接收待验证音频；/nB、对接收的音频信息进行预处理；预处理包含以下步骤：a)时长检测；b)静音检测；c)预加重；d)分帧加窗；/nC、进行声纹比对，判断身份信息。/n

【技术特征摘要】
1.一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，包括以下步骤：
A、接收待验证音频；
B、对接收的音频信息进行预处理；预处理包含以下步骤：a)时长检测；b)静音检测；c)预加重；d)分帧加窗；
C、进行声纹比对，判断身份信息。

2.根据权利要求1所述的一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，所述步骤a)具体是：根据传入语音，判断语音时长是否满足设定检测时长要求，不满足时长要求的，直接返回错误信息。

3.根据权利要求1所述的一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，所述步骤b)具体是：检测传入语音的分贝值是否大于设定阈值，当所有音频点分贝值都小于设定阈值时，返回错误信息。

4.根据权利要求1所述的一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，所述步骤c)通过一个高通滤波器来实现，其传输函数为：
H(z)＝1-μz-1
其中，z表示时间节点，H(z)表示对时刻z加重结果。

5.根据权利要求1所述的一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，所述步骤d)利用可以移动的规定长度的窗口函数的加权实现，以Hamming窗作为窗函数，函数表达式为：

其中，N表示窗口长度，n为其中取的折点数，w(x)表示选定窗口长度对呀折点n的幅度。

6.根据权利要求1所述的一种通过声纹引擎检测人声或机器音进行身份核验的方法，其特征在于，当声纹引擎打开了是否检测机器音功能开关时候，声纹引擎在对接收到的音频预处理完成后会异步对比进行声纹比对和是否是机器音验证两个步骤，其中异步对比就使用多线程的方式同时进行上述两...

【专利技术属性】
技术研发人员：任超，钟亚希，陈志骏，
申请(专利权)人：效生软件科技上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人