【技术实现步骤摘要】
基于静音游程的语音识别方法及其系统
本专利技术涉及语音识别领域,具体说的是基于静音游程的语音识别方法及其系统。
技术介绍
说话人识别是指根据人的语音信号由程序自动判断出说话者的身份,属于计算机生物特征识别的一种,可用于智能身份鉴别。一般语音信号可分为有声部分和静音部分(即说话中的无声停顿部分),由于静音部分不包含语音信息,因此在传统的说话人识别方法中一般都是将静音部分去除,提取有声信号的特征进行识别,例如基音周期、过零率、明亮度、线性预测系数、线性预测倒谱系数、MFCC、LPCC等特征。传统方法对于说话人识别的准确率达到一定水平后难以继续大幅提高,需要寻找新的识别特征和识别方法。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于静音游程的语音识别方法及其系统,有效提高语音识别的准确度。为了解决上述技术问题,本专利技术采用的技术方案为:基于静音游程的语音识别方法,包括:预设分别对应静音信号和非静音信号的二进制基本算符;对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;依据所述游程序列中的静音信号 ...
【技术保护点】
基于静音游程的语音识别方法,其特征在于,包括:预设分别对应静音信号和非静音信号的二进制基本算符;对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;依据所述游程序列中的静音信号提取游程特征,并存储至数据库;获取待识别的一段语音信号对应的待识别游程序列;依据所述待识别游程序列中的静音信号提取待识别游程特征;将所述待识别游程特征与数据库中的游程特征进行匹配。
【技术特征摘要】
1.基于静音游程的语音识别方法,其特征在于,包括:预设分别对应静音信号和非静音信号的二进制基本算符;对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;依据所述游程序列中的静音信号提取游程特征,并存储至数据库;获取待识别的一段语音信号对应的待识别游程序列;依据所述待识别游程序列中的静音信号提取待识别游程特征;将所述待识别游程特征与数据库中的游程特征进行匹配。2.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,所述游程特征包括游程距M1;依据公式获取所述游程距M1,其中,所述I为游程序列中静音信号对应的二进制基本算符的游程长度的随机变量,P(I)为游程长度为I的游程数量与静音信号对应的二进制基本算符的总游程数量的比值。3.如权利要求2所述的基于静音游程的语音识别方法,其特征在于,所述游程特征还包括游程中心距M2、游程绝对矩M3、游程熵M4和游程方差M5;依据公式获取所述游程中心距M2;依据公式获取所述游程绝对矩M3;依据公式获取所述游程熵M4;依据公式获取所述游程方差M5。4.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,所述对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列,具体为:预设语音强度阈值;获取大于预设长度的一段语音模拟信号;依据所述语音强度阈值,逐个确定所述语音信号中模拟信号为静音信号还是非静音信号;依据静音信号和非静音信号各自对应的二进制基本算符,将所述语音模拟信号转换成由二进制基本算符组成的游程序列。5.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,数据库中存储的游程特征的个数为两个以上;对应各游程特征预设唯一的标识符。6.如权利要求5所述的基于静音游程的语音识别方法,其特征在于,所述将所述待识别游程特征与数据库中的游程特征进行匹配,具体为:依据欧式距离公式,分别计算所述待识别游程特征与数据库中存储的各个游程特征的特征距离;获取数值最小的特...
【专利技术属性】
技术研发人员:涂岩恺,曹洪霞,王阳,牛方超,
申请(专利权)人:厦门雅迅网络股份有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。