一种声纹识别方法、装置、存储介质、服务器及系统制造方法及图纸

技术编号:24097356 阅读:38 留言:0更新日期:2020-05-09 11:04
本发明专利技术提供一种声纹识别方法,该方法包括:接收交换机通过MRCP协议发送的声纹识别请求,该请求中包含待识别的原始语音数据;利用预设语音去噪算法对原始语音数据进行去噪处理;提取去噪后的语音数据当中的声学特征,并将声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;将目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。本发明专利技术通过MRCP协议来推送原始语音数据,相比于抓包方式,可以减少语音信号的丢包概率,缩短声纹识别时间,提升声纹识别的处理效率,此外还对原始语音数据进行去噪处理,以去除原始语音中的环境噪音,降低声纹识别的误检概率,整体提高声纹识别的可靠性。

A voiceprint recognition method, device, storage medium, server and system

【技术实现步骤摘要】
一种声纹识别方法、装置、存储介质、服务器及系统
本专利技术属于声纹
,尤其涉及一种声纹识别方法、装置、存储介质、服务器及系统。
技术介绍
每个人的声音都蕴涵着特有的生物特征,声纹识别是指利用说话人的声音来识别说话人的一种技术手段。声纹识别同指纹识别等技术一样具有高度的安全可靠性,可以应用在所有需要做身份识别的场合。如在银行、证券、保险等金融领域。声纹识别的前提是需要预先录入用户语音,服务器通过对录入的用户语音进行声学特征提取,以注册该用户的声学特征值,形成声纹数据库,实际在进行声纹识别时,通过前端声音采集设备采集用户的现场语音,服务器对现场语音进行声学特征提取,并将提取的实际声学特征与声纹数据库进行匹配,匹配成功则声纹识别成功。现有技术当中,目前声纹识别方案中的前端声音采集设备大多为电话或者手机,银行交换机采用抓包方式根据某个用户的手机号码获取语音数据再推送到服务器做声纹识别,环境比较嘈杂,声音直接送入服务器做声纹识别存在误检的概率比较高,且采用抓包的方式提取语音信息,容易丢包且效率低,导致目前声纹识别方案整体可靠性较差。
技术实现思路
本专利技术实施例的目的在于提供一种声纹识别方法、装置、存储介质、服务器及系统,旨在解决现有技术当中声纹识别方案可靠性差的技术问题。本专利技术实施例是这样实现的,一种声纹识别方法,所述方法包括:接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;利用预设语音去噪算法对所述原始语音数据进行去噪处理;提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。更进一步的,所述将所述目标声学特征值在预设声纹数据库当中进行匹配的步骤包括:根据预设匹配算法,将所述目标声学特征值与所述预设声纹数据库当中的每一预设声学特征值进行匹配打分;从所有打分值当中提取最高打分值;判断所述最高打分值是否大于所述阈值;若是,则判定存在所述匹配率高于阈值的匹配结果。更进一步的,所述预设匹配算法为欧拉距离公式。更进一步的,在所述判定声纹识别成功的步骤之后,还包括:通过所述MRCP协议向所述交换机反馈声纹识别结果。更进一步的,所述利用预设语音去噪算法对所述原始语音数据进行去噪处理的步骤包括:利用改进的LMS自适应滤波算法去除所述原始语音数据当中的环境噪声。更进一步的,所述提取去噪后的语音数据当中的声学特征的步骤包括:利用MFCC算法提取所述去噪后的语音数据当中的声学特征;其中,所述目标声学特征值和预设声学特征值均为256维的一阶向量。此外,本专利技术实施例还提出一种声纹识别装置,所述系统包括:请求接收模块,用于接收交换机通过预设协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;语音去噪模块,用于利用预设语音去噪算法对所述原始语音数据进行去噪处理;特征提取模块,用于提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;声纹识别模块,用于将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。此外,本专利技术实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的声纹识别方法。此外,本专利技术实施例还提出一种服务器,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的声纹识别方法。此外,本专利技术实施例还提出一种声纹识别系统,所述系统包括:如上述的服务器;采用MRCP协议与所述服务器通讯连接的交换机;以及与所述交换机通讯连接并用于采集原始语音数据的终端。与现有技术相比:通过MRCP协议来推送原始语音数据,相比于抓包方式,可以减少语音信号的丢包概率,缩短声纹识别时间,提升声纹识别的处理效率,此外服务器在进行声纹识别之前,采用预设语音去噪算法对原始语音数据进行去噪处理,以去除原始语音中的环境噪音,降低声纹识别的误检概率,整体提高声纹识别的可靠性。附图说明图1是本专利技术实施例当中提供的声纹识别系统的结构图;图2是本专利技术实施例当中提供的声纹识别系统的通讯架构图;图3是本专利技术实施例一提供的声纹识别方法的流程示意图;图4是本专利技术实施例二提供的声纹识别方法的流程示意图;图5是本专利技术实施例三提供的声纹识别装置的模块示意图;图6是本专利技术实施例四提供的服务器的模块示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术针对现有声纹识别方案存在丢包及误检概率高、导致整体方案不可靠的技术问题,提出一种声纹识别方法、装置、存储介质、服务器及系统,以通过MRCP协议以及环境去噪技术来降低丢包及误检概率,提高声纹识别的可靠性。以下各实施例均可应用到图1和图2所示的声纹识别系统当中,请参阅图1,图1是本申请实施例提供的一种声纹识别系统的结构示意图。该系统包括:位于局域网侧(LocalAreaNetwork,LAN)的交换机101、前端声音采集设备102以及位于广域网(WideAreaNetwork,WAN)侧的服务端103。交换机101、前端声音采集设备102以及服务端103通过有线和/或无线网络进行通信,无线网络可以为但不限于Wi-Fi网络、蓝牙、Zigbee、移动通信网络,全球导航卫星系统(globalnavigationsatellitesystem,GNSS)、调频(frequencymodulation,FM)、近距离无线通信技术(nearfieldcommunication,NFC)、红外技术(infrared,IR)等。具体地,前端声音采集设备102可以为手机/固定电话,用于采集用户的原始语音数据流,当前端声音采集设备102采用局域网络(如Wi-Fi、蓝牙等)与交换机101通讯时,交换机101可以为前端声音采集设备102附近的交换机,如银行交换机,当前端声音采集设备102采用广域网(如移动通信网络、射频等)与交换机101通讯时,交换机101可以为广域网中的交换机,如移动4G网络交换机,交换机101主要负责获取前端声音采集设备102采集的用户的原始语音数据流,并将该原始语音数据流推送给服务器103,同时接收服务器103反馈的声纹识别结果(识别成功或失败)并推送给前端声音采集设备102。需要指出的是,图1示出的结构并不构成对声纹识别系统的限定,在其它实施例当中,该系统可以包括比图示更少本文档来自技高网...

【技术保护点】
1.一种声纹识别方法,其特征在于,所述方法包括:/n接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;/n利用预设语音去噪算法对所述原始语音数据进行去噪处理;/n提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;/n将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。/n

【技术特征摘要】
1.一种声纹识别方法,其特征在于,所述方法包括:
接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;
利用预设语音去噪算法对所述原始语音数据进行去噪处理;
提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;
将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。


2.如权利要求1所述的声纹识别方法,其特征在于,所述将所述目标声学特征值在预设声纹数据库当中进行匹配的步骤包括:
根据预设匹配算法,将所述目标声学特征值与所述预设声纹数据库当中的每一预设声学特征值进行匹配打分;
从所有打分值当中提取最高打分值;
判断所述最高打分值是否大于所述阈值;
若是,则判定存在所述匹配率高于阈值的匹配结果。


3.如权利要求2所述的声纹识别方法,其特征在于,所述预设匹配算法为欧拉距离公式。


4.如权利要求1所述的声纹识别方法,其特征在于,在所述判定声纹识别成功的步骤之后,还包括:
通过所述MRCP协议向所述交换机反馈声纹识别结果。


5.如权利要求1所述的声纹识别方法,其特征在于,所述利用预设语音去噪算法对所述原始语音数据进行去噪处理的步骤包括:
利用改进的LMS自适应滤波算法去除所述原始语音数据当中的环境噪声。

【专利技术属性】
技术研发人员:叶林勇肖龙源李稀敏蔡振华刘晓葳
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1