The invention discloses a recognition model updating method and system and intelligent terminal, which belongs to the field of speech recognition technology; method includes: obtaining the initial voice signal flow; according to the segmentation and clustering algorithm for speech signal initial voice signal flow respectively associated with each speaker flow; to determine all the speech signal stream can be used as the existence of speech signal recognition object flow and signal flow as the recognition output; the identification signal of each speaker flow are respectively matched with the initial recognition model of a pre formed, obtaining successful matching recognition signal flow; the identification signal is successful, the additional flow identification signal flow as the training samples, and on the basis of training on initial recognition the model is updated, and ultimately the formation of multiple recognition models, each corresponding to a speaker recognition model. The beneficial effects of the technical scheme is: taking into account the accuracy on the application of intelligent terminal in the form recognition model required better practicability and voiceprint recognition required.
【技术实现步骤摘要】
一种识别模型更新方法及系统以及智能终端
本专利技术涉及语音识别
,尤其涉及一种识别模型更新方法及系统以及智能终端。
技术介绍
声纹识别是一种利用人的声音实现的识别技术,由于人在讲话时使用的发声器官存在一定的差异性,任何两个人声音的声纹图谱都有差异,所以声纹可以作为表征个体差异的生物特征,因此可以通过建立识别模型来表征不同的个体,进而利用该识别模型识别不同的个体。目前识别模型的应用存在一个两难的选择,主要体现在训练语料的长度选取上。一般而言,声纹训练的语料越长,建立的特征模型越精确,识别准确率也就越高,但是这种模型建立的方式的实用性不强;相反地,声纹训练语料较短,能保证较好的实用性,但相对而言其训练生成的模型的识别准确率不高。而在实际应用中,例如应用到一些智能设备中进行语音操作的声纹识别时,既要求有较高的识别准确率,又要求训练语料不能太长,从而保证较好的实用性,则以现有技术中的声纹识别模型建立的技术方案难以实现上述目的。同样地,现有技术中,需要由用户手动多次录入一定时长的训练语料来辅助建立识别模型,因此会给用户较差的体验,不具备较高的实用性;同时,组合起来的训练语料的长度仍然有限,不能生成较精确的特征模型,识别准确率无法进一步提升;语速语调的变化、情绪波动等也都会影响模型建立的精确度。所以,如何在保证较高的实用性前提下,提高识别模型精确度,进而提高识别准确率是急需解决的问题。
技术实现思路
根据现有技术中存在的上述问题,现提供一种识别模型更新方法及系统以及智能终端的技术方案,具体包括:一种识别模型更新方法,其中,所述方法包括:获取包含至少一个说话人的初始语 ...
【技术保护点】
一种识别模型更新方法,其特征在于,所述方法包括:获取包含至少一个说话人的初始语音信号流;根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流;判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流;将匹配成功的所述识别信号流作为追加的识别信号流的训练样本,并依据所述训练样本对所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。
【技术特征摘要】
1.一种识别模型更新方法,其特征在于,所述方法包括:获取包含至少一个说话人的初始语音信号流;根据预设的说话人分割算法和说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流;判断所有所述语音信号流中是否存在能够作为识别对象的所述语音信号流,并将能够作为识别对象的所述语音信号流作为识别信号流输出;将每个所述说话人的所述识别信号流分别与一预先形成的初始识别模型进行匹配,获取匹配成功的所述识别信号流;将匹配成功的所述识别信号流作为追加的识别信号流的训练样本,并依据所述训练样本对所述初始识别模型进行更新,最终形成多个识别模型,每个所述识别模型对应于一个所述说话人。2.如权利要求1所述的识别模型更新方法,其特征在于,所述方法在获取包含至少一个说话人的初始语音信号流之前还包括:根据预设的所述训练样本建立初始识别模型。3.如权利要求1或2所述的识别模型更新方法,其特征在于,根据所述说话人分割算法与所述说话人聚类算法,分别获取所述初始语音信号流中的关联于每个所述说话人的所述语音信号流的方法具体包括:根据所述说话人分割算法,将所述初始语音信号流分割成多个语音分段,每个所述语音分段中仅包含同一个所述说话人的语音信息;根据所述说话人聚类算法,将关联于同一个所述说话人的所述语音分段进行聚类,生成仅关联于同一个所述说话人的所述语音信号流。4.如权利要求1或2所述的识别模型更新方法,其特征在于,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。5.如权利要求3所述的识别模型更新方法,其特征在于,分别将每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取匹配成功的所述识别信号流的方法具体包括:分别根据每个所述说话人的所述识别信号流与所述初始识别模型进行匹配,获取所述每个所述识别信号流与所述初始识别模型的匹配度;选取大于预设的匹配阈值的多个所述匹配度中最高的所述匹配度所对应的所述识别信号流作为匹配成功的所述识别信号流。6.如权利要求1,2和5中任意一项所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。7.如权利要求3所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。8.如权利要求4所述的识别模型更新方法,其特征在于,将匹配成功的所述识别信号流作为对所述初始识别模型进行更新的追加的所述识别信号流的所述训练样本,并对所述初始识别模型进行更新的方法具体包括:根据匹配成功的所述识别信号流以及预设的训练样本,生成修正识别模型,预设的所述训练样本为生成所述初始识别模型的所述识别信号流;以所述修正识别模型对所述初始识别模型进行更新。9.一种识别模型更新系统,其特征在于,包括:获取单元、处理单元、匹配单元以及模型更新单元;获取单元,用于获取包含至少一个说话人的初始语音信号流并发送给与所述获取单元连接的处理单元;所述处理单元用于接收所述获取单元发送的所述初始语音信号流,并根据预设的说话人分割算法与说话人聚类算法,获取所述初始语音信号流中分别关联于每一个所述说话人的所述语音信号流,并分别将关联于每一个所述说话...
【专利技术属性】
技术研发人员:祝铭明,
申请(专利权)人:芋头科技杭州有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。