一种识别模型更新方法及系统以及智能终端技术方案

技术编号:15705544 阅读:248 留言:0更新日期:2017-06-26 14:15
本发明专利技术公开了一种识别模型更新方法及系统以及智能终端,属于语音识别技术领域;方法包括:获取初始语音信号流;根据分割和聚类算法,获取初始语音信号流中分别关联于每个说话人的语音信号流;判断所有语音信号流中是否存在能够作为识别对象的语音信号流并作为识别信号流输出;将每个说话人的识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的识别信号流;将匹配成功的识别信号流作为追加的识别信号流的训练样本,并依据训练样本对初始识别模型进行更新,最终形成多个识别模型,每个识别模型对应于一个说话人。上述技术方案的有益效果是:兼顾应用于智能终端中形成识别模型所需的较好的实用性以及声纹识别所需的准确度。

Identification model updating method and system and intelligent terminal

The invention discloses a recognition model updating method and system and intelligent terminal, which belongs to the field of speech recognition technology; method includes: obtaining the initial voice signal flow; according to the segmentation and clustering algorithm for speech signal initial voice signal flow respectively associated with each speaker flow; to determine all the speech signal stream can be used as the existence of speech signal recognition object flow and signal flow as the recognition output; the identification signal of each speaker flow are respectively matched with the initial recognition model of a pre formed, obtaining successful matching recognition signal flow; the identification signal is successful, the additional flow identification signal flow as the training samples, and on the basis of training on initial recognition the model is updated, and ultimately the formation of multiple recognition models, each corresponding to a speaker recognition model. The beneficial effects of the technical scheme is: taking into account the accuracy on the application of intelligent terminal in the form recognition model required better practicability and voiceprint recognition required.

【技术实现步骤摘要】
一种识别模型更新方法及系统以及智能终端
本专利技术涉及语音识别
,尤其涉及一种识别模型更新方法及系统以及智能终端。
技术介绍
声纹识别是一种利用人的声音实现的识别技术,由于人在讲话时使用的发声器官存在一定的差异性,任何两个人声音的声纹图谱都有差异,所以声纹可以作为表征个体差异的生物特征,因此可以通过建立识别模型来表征不同的个体,进而利用该识别模型识别不同的个体。目前识别模型的应用存在一个两难的选择,主要体现在训练语料的长度选取上。一般而言,声纹训练的语料越长,建立的特征模型越精确,识别准确率也就越高,但是这种模型建立的方式的实用性不强;相反地,声纹训练语料较短,能保证较好的实用性,但相对而言其训练生成的模型的识别准确率不高。而在实际应用中,例如应用到一些智能设备中进行语音操作的声纹识别时,既要求有较高的识别准确率,又要求训练语料不能太长,从而保证较好的实用性,则以现有技术中的声纹识别模型建立的技术方案难以实现上述目的。同样地,现有技术中,需要由用户手动多次录入一定时长的训练语料来辅助建立识别模型,因此会给用户较差的体验,不具备较高的实用性;同时,组合起来的训练语料的长度仍然有限,不能生成较精确的特征模型,识别准确率无法进一步提升;语速语调的变化、情绪波动等也都会影响模型建立的精确度。所以,如何在保证较高的实用性前提下,提高识别模型精确度,进而提高识别准确率是急需解决的问题。
技术实现思路
根据现有技术中存在的上述问题,现提供一种识别模型更新方法及系统以及智能终端的技术方案,具体包括:一种识别模型更新方法,其中,所述方法包括:获取包含至少一个说话人的初始语音信号流;根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流;判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流;将匹配成功的所述识别信号流作为追加的识别信号流的训练样本,并依据所述训练样本对所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。优选的,该识别模型更新方法,其中,所述方法在获取包含至少一个说话人的初始语音信号流之前还包括:根据预设的所述训练样本建立初始识别模型。优选的,该识别模型更新方法,其中,根据所述说话人分割算法与所述说话人聚类算法,分别获取所述初始语音信号流中的关联于每个所述说话人的所述语音信号流的方法具体包括:根据所述说话人分割算法,将所述初始语音信号流分割成多个语音分段,每个所述语音分段中仅包含同一个所述说话人的语音信息;根据所述说话人聚类算法,将关联于同一个所述说话人的所述语音分段进行聚类,生成仅关联于同一个所述说话人的所述语音信号流。优选的,该识别模型更新方法,其中,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。优选的,该识别模型更新方法,其中,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。优选的,该识别模型更新方法,其中,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。优选的,该识别模型更新方法,其中,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。优选的,该识别模型更新方法,其中,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。一种识别模型更新系统,其中,包括:获取单元、处理单元、匹配单元以及模型更新单元;获取单元,用于获取包含至少一个说话人的初始语音信号流并发送给与所述获取单元连接的处理单元;所述处理单元用于接收所述获取单元发送的所述初始语音信号流,并根据预设的说话人分割算法与说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流,并分别将关联于每一个所述说话人的所述语音信号流发送给与所述处理单元连接的判断单元;所述判断单元用于判断所述处理单元发送的所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出至与所述判断单元连接的匹配单元;所述匹配单元用于接收所述判断单元发送的分别关联于每一个所述说话人的所述识别信号流,且将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流,并将匹配成功的所述识别信号流发送给与所述匹配单元连接的模型更新单元;以及所述模型更新单元用于接收所述匹配单元发送的匹配成功的所述识别信号流,并将匹配成功的所述识别信号流作为追加的所述识别信号流的训练样本,以对所述初始识别模型进行更新。优选的,该识别模型更新系统,其中,还包括:样本获取单元,用于获取预设的所述训练样本并发送给与所述样本获取单元连接的模型建立单元;以及所述模型建立单元用于接收所述样本获取单元发送的预设的所述训练样本并根据预设的所述训练样本建立所述初始识别模型。优选的,该识别模型更新系统,其中,所述处理单元具体包括:分割模块,用于根据预设的所述说话人分割算法,将所述初始语音信号流分割成多个语音分段,每个所述语音分段中仅包含同一个所述说话人的语音信息,并将所有所述语音分段发送给与所述分割模块连接的聚类模块;以及所述聚类模块用于接收所述分割模块发送的所述语音分段,并根据预设的所述说话人聚类算法,将关联于同一个所述说话人的所述语音分段进行聚类,生成仅关联于同一个所述说话人的语音信号流。优选的,该识别模型更新系统,其中,所述匹配单元具体包括:匹配度获取模块,用于分别根据每个所述说话人的所述识别信号本文档来自技高网...
一种识别模型更新方法及系统以及智能终端

【技术保护点】
一种识别模型更新方法,其特征在于,所述方法包括:获取包含至少一个说话人的初始语音信号流;根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流;判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流;将匹配成功的所述识别信号流作为追加的识别信号流的训练样本,并依据所述训练样本对所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。

【技术特征摘要】
1.一种识别模型更新方法,其特征在于,所述方法包括:获取包含至少一个说话人的初始语音信号流;根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流;判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流;将匹配成功的所述识别信号流作为追加的识别信号流的训练样本,并依据所述训练样本对所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。2.如权利要求1所述的识别模型更新方法,其特征在于,所述方法在获取包含至少一个说话人的初始语音信号流之前还包括:根据预设的所述训练样本建立初始识别模型。3.如权利要求1或2所述的识别模型更新方法,其特征在于,根据所述说话人分割算法与所述说话人聚类算法,分别获取所述初始语音信号流中的关联于每个所述说话人的所述语音信号流的方法具体包括:根据所述说话人分割算法,将所述初始语音信号流分割成多个语音分段,每个所述语音分段中仅包含同一个所述说话人的语音信息;根据所述说话人聚类算法,将关联于同一个所述说话人的所述语音分段进行聚类,生成仅关联于同一个所述说话人的所述语音信号流。4.如权利要求1或2所述的识别模型更新方法,其特征在于,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。5.如权利要求3所述的识别模型更新方法,其特征在于,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。6.如权利要求1,2和5中任意一项所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。7.如权利要求3所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。8.如权利要求4所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。9.一种识别模型更新系统,其特征在于,包括:获取单元、处理单元、匹配单元以及模型更新单元;获取单元,用于获取包含至少一个说话人的初始语音信号流并发送给与所述获取单元连接的处理单元;所述处理单元用于接收所述获取单元发送的所述初始语音信号流,并根据预设的说话人分割算法与说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流,并分别将关联于每一个所述说话...

【专利技术属性】
技术研发人员:祝铭明
申请(专利权)人:芋头科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1