一种基于大数据的智能声纹识别方法技术

技术编号:24012942 阅读:86 留言:0更新日期:2020-05-02 02:22
本发明专利技术公开了一种基于大数据的智能声纹识别方法,属于声纹识别技术领域,该基于大数据的智能声纹识别方法,通过语音识别中对注册语音进行特征提取,存入声纹数据库中并且与验证所提取的语音特征诗句进行整合对比,注册语音获取测试声纹特征,并将验证声纹特征与注册声纹特征进行对比,以确定验证声纹特征与注册声纹特征的说话人是否为同一用户,可达到快速语音识别效果,提高语音识别效率,而且通过LPCC参数,其最大优点是能够极为精确地估计语音参数,用较少的参数有效而又正确地表现语音波形频谱的性质,而且计算效率高,且对元音有较好的表示能力,提高了数据表达的准确性。

An intelligent voiceprint recognition method based on big data

【技术实现步骤摘要】
一种基于大数据的智能声纹识别方法
本专利技术属于声纹识别
,具体为一种基于大数据的智能声纹识别方法。
技术介绍
声纹识别,也称为说话人识别,有两类,即说话人辨认和说话人确认,前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题,而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题,不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术,不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程,识别说话人的一种身份识别技术,由于声纹识别具有安全可靠性,使其可在几乎所有需求进行身份识别的安全性保护领域和个性化应用场合中使用,如在银行、证券、保险等金融机构的业务量持续扩大,产生大量的身份识别需求。目前在声纹识别技术中,声纹识别方法比如早期的基于信号处理的声纹识别方法,使用信号处理技术中一些技术方法计算出语音数据在信号学的参数,然后进行模板匹配、统计方差分析等,该方法对语音数据极为敏感,准确率很低,识别效果很不理想,而且在一些特殊区域进行语音识别终端上进行语音验证时,一些不法分子进行语音模仿及录制的语音进行声纹破解时,未设有相应的提示及警报指令发出,不便于管理人员实时进行了解并且进行紧急处理,适用性具有一定的局限性。
技术实现思路
(一)解决的技术问题为了克服现有技术的上述缺陷,本专利技术提供了一种基于大数据的智能声纹识别方法,解决了信号处理技术中一些技术方法计算出语音数据在信号学的参数,然后进行模板匹配、统计方差分析等,该方法对语音数据极为敏感,准确率很低,识别效果很不理想,而且在一些特殊区域进行语音识别终端上进行语音验证时,一些不法分子进行语音模仿及录制的语音进行声纹破解时,未设有相应的提示及警报指令发出,不便于管理人员实时进行了解并且进行紧急处理,适用性具有一定的局限性的问题。(二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的智能声纹识别方法,包括以下步骤:步骤一、首先进行声纹注册,接收客户语音声源,客户端采集用户的测试语音,并向后台服务器发送语音识别请求进行语音录入。步骤二、对录入的语音进行语音活动检测,从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源。步骤三、通过对识别的语音进行增强,可对语音进行有效的抑噪,适用于人们在不同的环境进行检测及识别。步骤四、通过对语音的质量检测,其检测的方式包括三个方面,即语音的清晰度、可懂度和自然度,其次再对语音特征进行有效的提取,并且对基础声纹特征集中的声纹特征进行训练,得到每个基础声纹特征集的综合声纹特征。步骤五、将得出的声纹特征储存在声纹数据库中,其次对储存的声纹进行验证,通过用户终端对用户的语音进行录入,并且依次对录入的语音进行语音活动检测、语音增强、语音质量检测、有效语音提取和声纹特征提取。步骤六、将注册中声纹特征提取的信息与声纹特征提取的信息进行对比,将声纹数据库中声纹特征信息与声纹验证特征信息进行对比计算。步骤七、在步骤六中的算法公式采用遗传算法上的改进算法,通过LPCC特征参数的提取,基于语音信号为自回归信号的假设,利用线性预测分析从而获得倒谱参数并且对声纹特征信息进行识别。步骤八、在进行识别的过程中,若识别通过,则将通过消息传递至用户手机终端上进行提示,若识别失败,识别终端将警报信息发送至用户手机终端,使用户及时进行戒备及采取应急措施。作为本专利技术的进一步方案:所述语音活动检测采用语言VAD方式进行检测。作为本专利技术的进一步方案:所述步骤四中,清晰度是指语音中语言单元为意义不连贯的(如音素、声母、韵母等)单元的清晰程度,可懂度是指语音中有意义的语言单元(如单词、单句等)内容的可识别程度,自然度则与语音的保真性密切相关。作为本专利技术的进一步方案:所述步骤四中,语音质量受到个人区别、可理解性、语音特征、周围环境、背景噪声传输、网络状况和人的期望等复杂的因素影响。(三)有益效果与现有技术相比,本专利技术的有益效果在于:1、该基于大数据的智能声纹识别方法,通过语音识别中对注册语音进行特征提取,存入声纹数据库中并且与验证所提取的语音特征诗句进行整合对比,注册语音获取测试声纹特征,并将验证声纹特征与注册声纹特征进行对比,以确定验证声纹特征与注册声纹特征的说话人是否为同一用户,可达到快速语音识别效果,提高语音识别效率,而且通过LPCC参数,其最大优点是能够极为精确地估计语音参数,用较少的参数有效而又正确地表现语音波形频谱的性质,而且计算效率高,且对元音有较好的表示能力,提高了数据表达的准确性。2、该基于大数据的智能声纹识别方法,通过对声纹特征进行实时识别,声纹特征符合时,将识别通过,并且将该用户识别成功的数据信息传递至管理人员手机终端和PC终端,当识别未通过时,则有三次机会重新进行识别,仍然识别未通过时,声纹识别终端将发出预警信息并且将其传递至管理人员手机终端和PC终端,若通过声纹识别以外的方式将识别终端进行破解时,则识别终端也会发出预警信息并且将信息进行传递,便于管理人员实时进行了解并且进行紧急处理,适用性较强。附图说明图1为本专利技术操作步骤的流程示意图。具体实施方式下面结合具体实施方式对本专利的技术方案作进一步详细地说明。如图1所示,本专利技术提供一种技术方案:一种基于大数据的智能声纹识别方法,包括以下步骤:步骤一、首先进行声纹注册,接收客户语音声源,客户端采集用户的测试语音,并向后台服务器发送语音识别请求进行语音录入。步骤二、对录入的语音进行语音活动检测,从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源。步骤三、通过对识别的语音进行增强,可对语音进行有效的抑噪,适用于人们在不同的环境进行检测及识别。步骤四、通过对语音的质量检测,其检测的方式包括三个方面,即语音的清晰度、可懂度和自然度,其次再对语音特征进行有效的提取,并且对基础声纹特征集中的声纹特征进行训练,得到每个基础声纹特征集的综合声纹特征。步骤五、将得出的声纹特征储存在声纹数据库中,其次对储存的声纹进行验证,通过用户终端对用户的语音进行录入,并且依次对录入的语音进行语音活动检测、语音增强、语音质量检测、有效语音提取和声纹特征提取。步骤六、将注册中声纹特征提取的信息与声纹特征提取的信息进行对比,将声纹数据库中声纹特征信息与声纹验证特征信息进行对比计算。步骤七、在步骤六中的算法公式采用遗传算法上的改进算法,通过LPCC特征参数的提取,基于语音信号为自回归信号的假设,利用线性预测分析从而获得倒谱参数并且对声纹特征信息进行识别。步骤八、在进行识别的过程中,若识别通过,则将通过消息传递至用户手机终端上进行提示,若识别失败,识别终端将警报信息发送至用户手机终端,使用户及时进行戒备及采取应急措施。所本文档来自技高网...

【技术保护点】
1.一种基于大数据的智能声纹识别方法,其特征在于:包括以下步骤:/n步骤一、首先进行声纹注册,接收客户语音声源,客户端采集用户的测试语音,并向后台服务器发送语音识别请求进行语音录入。/n步骤二、对录入的语音进行语音活动检测,从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源。/n步骤三、通过对识别的语音进行增强,可对语音进行有效的抑噪,适用于人们在不同的环境进行检测及识别。/n步骤四、通过对语音的质量检测,其检测的方式包括三个方面,即语音的清晰度、可懂度和自然度,其次再对语音特征进行有效的提取,并且对基础声纹特征集中的声纹特征进行训练,得到每个基础声纹特征集的综合声纹特征。/n步骤五、将得出的声纹特征储存在声纹数据库中,其次对储存的声纹进行验证,通过用户终端对用户的语音进行录入,并且依次对录入的语音进行语音活动检测、语音增强、语音质量检测、有效语音提取和声纹特征提取。/n步骤六、将注册中声纹特征提取的信息与声纹特征提取的信息进行对比,将声纹数据库中声纹特征信息与声纹验证特征信息进行对比计算。/n步骤七、在步骤六中的算法公式采用遗传算法上的改进算法,通过LPCC特征参数的提取,基于语音信号为自回归信号的假设,利用线性预测分析从而获得倒谱参数并且对声纹特征信息进行识别。/n步骤八、在进行识别的过程中,若识别通过,则将通过消息传递至用户手机终端上进行提示,若识别失败,识别终端将警报信息发送至用户手机终端,使用户及时进行戒备及采取应急措施。/n...

【技术特征摘要】
1.一种基于大数据的智能声纹识别方法,其特征在于:包括以下步骤:
步骤一、首先进行声纹注册,接收客户语音声源,客户端采集用户的测试语音,并向后台服务器发送语音识别请求进行语音录入。
步骤二、对录入的语音进行语音活动检测,从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源。
步骤三、通过对识别的语音进行增强,可对语音进行有效的抑噪,适用于人们在不同的环境进行检测及识别。
步骤四、通过对语音的质量检测,其检测的方式包括三个方面,即语音的清晰度、可懂度和自然度,其次再对语音特征进行有效的提取,并且对基础声纹特征集中的声纹特征进行训练,得到每个基础声纹特征集的综合声纹特征。
步骤五、将得出的声纹特征储存在声纹数据库中,其次对储存的声纹进行验证,通过用户终端对用户的语音进行录入,并且依次对录入的语音进行语音活动检测、语音增强、语音质量检测、有效语音提取和声纹特征提取。
步骤六、将注册中声纹特征提取的信息与声纹特征提取的信息进行对比,将声纹数据库中声纹特征信息与声纹验证特征信息进行对比计算。
步骤七...

【专利技术属性】
技术研发人员:王桂林陈继焱
申请(专利权)人:武汉九元之泰电子科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1