语音对比方法、终端及计算机可读存储介质技术

技术编号:18716829 阅读:46 留言:0更新日期:2018-08-21 23:36
本发明专利技术公开了一种语音对比方法,应用于终端,包括步骤:计算注册语音的第一特征语音向量;利用K‑means聚类将所述第一特征语音向量聚类为K类;获取K类中每一类的质心,所述质心为所述质心所属类中的一个第一特征语音向量;获取用户的验证语音并计算所述验证语音的第二特征语音向量;将所述第二特征语音向量分别与所述每一类的质心进行比对;根据比对结果判断所述验证语音所属的类别;当判断出所述验证语音所属的类别后,将所述第二特征语音向量分别与所述验证语音所属的类别中的所有所述第一特征语音向量进行比对;输出比对结果。本发明专利技术还提供一种终端及计算机可读存储介质。本发明专利技术通过上述方式,大幅度减少计算时间,使终端能够实时返回结果。

Speech comparison method, terminal and computer readable storage medium

The invention discloses a speech contrast method applied to a terminal, comprising steps of calculating the first characteristic speech vector of a registered speech, clustering the first characteristic speech vector into K classes using K_means clustering, and obtaining the center of mass of each class in K classes, the center of mass being the first characteristic speech direction of one of the classes to which the center of mass belongs. Quantity; obtaining the user's verification speech and calculating the second feature speech vector of the verification speech; comparing the second feature speech vector with the center of mass of each class; judging the category of the verification speech according to the comparison result; and judging the category of the verification speech, the second feature speech is described. The feature speech vectors are compared with all the first feature speech vectors in the category to which the verification speech belongs, and the comparison results are output. The invention also provides a terminal and a computer readable storage medium. By adopting the above method, the invention greatly reduces computation time and enables the terminal to return the result in real time.

【技术实现步骤摘要】
语音对比方法、终端及计算机可读存储介质
本专利技术涉及通信
,尤其涉及一种语音对比方法、终端及计算机可读存储介质。
技术介绍
随着语音识别技术的不断发展,支持语音识别的应用也越来越多,比如语音开锁,语音支付等等。但在语音识别技术的应用中,其中涉及非常重要的一步就是验证语音与声纹库中N个注册语音的比对。目前传统的语音比对是利用1比N系统,然而1比N系统在识别时,识别语音的i-Vector要和声纹库中的N个语音的i-Vector(特征语音向量)分别进行比对,一共要有N次计算,耗费大量时间,导致比对效率低下,进而不利于语音识别技术的普及和应用。
技术实现思路
有鉴于此,本专利技术提出一种语音对比方法、终端及计算机可读存储介质,通过实施上述方式,可以克服现有声纹系统在识别时要和声纹库中的N个人分别进行比对,耗费大量时间的弊端,进而提升语音识别的效率,促进语音识别技术的普及和产业化发展。首先,为实现上述目的,本专利技术提出一种终端,所述移动终端包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的语音对比程序,所述语音对比程序被所述处理器执行时实现如下步骤:计算注册语音的第一特征语音向本文档来自技高网...

【技术保护点】
1.一种语音对比方法,应用于终端,其特征在于,所述方法包括步骤:计算注册语音的第一特征语音向量;利用K‑means聚类将所述第一特征语音向量聚类为K类;获取K类中每一类的质心,所述质心为所述质心所属类中的一个第一特征语音向量;获取用户的验证语音并计算所述验证语音的第二特征语音向量;将所述第二特征语音向量分别与所述每一类的质心进行比对;根据比对结果判断所述验证语音所属的类别;当判断出所述验证语音所属的类别后,将所述第二特征语音向量分别与所述验证语音所属的类别中的所有所述第一特征语音向量进行比对;及输出比对结果。

【技术特征摘要】
1.一种语音对比方法,应用于终端,其特征在于,所述方法包括步骤:计算注册语音的第一特征语音向量;利用K-means聚类将所述第一特征语音向量聚类为K类;获取K类中每一类的质心,所述质心为所述质心所属类中的一个第一特征语音向量;获取用户的验证语音并计算所述验证语音的第二特征语音向量;将所述第二特征语音向量分别与所述每一类的质心进行比对;根据比对结果判断所述验证语音所属的类别;当判断出所述验证语音所属的类别后,将所述第二特征语音向量分别与所述验证语音所属的类别中的所有所述第一特征语音向量进行比对;及输出比对结果。2.如权利要求1所述的语音对比方法,其特征在于,所述计算注册语音的第一特征语音向量的步骤,包括:使用MFCC方法提取所述注册语音中每帧语音的MFCC特征并组成第一矩阵;使用UBM通用背景模型和语音向量提取器筛选出所述第一矩阵中最核心的特征,组成所述第一特征语音向量;所述计算所述验证语音的第二特征语音向量的步骤,包括:使用MFCC方法分别提取所述验证语音中每帧语音的MFCC特征并组成第二矩阵;及使用UBM通用背景模型和语音向量提取器筛选出所述第二矩阵中最核心的特征,组成所述第二特征语音向量。3.如权利要求1所述的语音对比方法,其特征在于,所述利用K-means聚类将所述第一特征语音向量聚类为K类的步骤,包括:从所述第一特征语音向量中选出K个所述第一特征语音向量作为K-means聚类的样本;以所述K-means聚类的样本中K个所述第一特征语音向量为聚类中心;及将所有所述第一特征语音向量中与任何一个所述聚类中心距离最近的所述第一特征向量聚为一类,进而将所有所述第一特征语音向量聚类为K类。4.如权利要求1-3任一项所述的语音对比方法,其特征在于,所述将所述第二特征语音向量分别与所述每一类的质心进行比对的步骤,包括:利用向量点积算法和PLDA算法对所述第二特征语音向量和所述每一类的质心进行两两对比打分。5.如权利要求4所述的语音对比方法,其特征在于,所述根据比对结果判断所述验证语音所属的类别的步骤,包括:从所述比对结果中选择分数最低的两两对比打分;及将所述验证语音归类到分数最低的两两对比打分对应的类别。6.一种终端,其特征在于,所述终端包括存储器、处理器,所述存储器上存...

【专利技术属性】
技术研发人员:王健宗黄章成吴天博肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1