一种用户声纹模型构建方法、装置及系统制造方法及图纸

技术编号：14517155 阅读：88 留言：0更新日期：2017-02-01 19:27

本申请公开了一种用户声纹模型构建方法、装置及系统。一种用户声纹模型构建方法包括：接收用户输入的语音信息；判断所述语音信息中是否携带满足建模要求的预设关键词；在判断结果为是的情况下，从所述语音信息中截取出于对应于所述满足建模要求的预设关键词的语音片段；利用所述语音片段，为所述用户构建声纹模型。应用本申请所提供的技术方案，可以在任意能够接收到用户语音的应用场景下，自动完成用户声纹模型的构建，方便用户使用。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机应用
，尤其涉及一种用户声纹模型构建方法、装置及系统。
技术介绍
声纹(voiceprint)是生物特征的一种，声纹识别是根据说话人的发音生理和行为特征，自动识别说话人身份的一种生物识别方法。声纹识别所提供的安全性可与其他生物识别技术(如：指纹、虹膜等)相媲美，而且语音采集装置只需电话/手机或麦克风即可，无需特殊的设备；它与说话语言无关，与方言腔调无关，不涉及隐私问题，适应人群范围很广；声音信号便于远程传输和获取，在基于电信和网络的身份识别应用中，声纹识别更有着特殊的优势声纹识别主要包括两个阶段：一是注册阶段：需要用户预先向系统录制一段语音内容，系统利用从注册语音中提取的声纹特征，为用户构建声纹模型；二是应用阶段：用户根据系统提示说出指定的语音片段，系统自动地录取用户的语音并提取声纹特征，将新提取到的声纹特征与预先构建的声纹模型进行匹配运算，然后根据二者的匹配程度对当前用户的身份进行识别。随着计算机和互联网技术的发展，声纹识别已经逐渐渗透到人们的日常生活中，例如智能终端应用，自动电话服务系统等等。根据上面的介绍可知，注册是整个声纹识别过程中不可缺少的环节，然而，这个注册环节却会在一定程度上给用户的使用带来不便，特别是对于中老年人等对新技术不敏感的特殊群体，甚至存在能否顺利注册声纹的问题。另外在有些情况下，为了提高系统安全性或鲁棒性，可能要求用户在注册阶段录制多个语音片段，这样会进一步增加用户的使用难度。
技术实现思路
本申请提供一种用户声纹模型构建方法、装置及系统，以降低声纹认证系统的使用难度，技术方案如下：本申请提供一...

【技术保护点】
一种用户声纹模型构建方法，其特征在于，该方法包括：接收用户输入的语音信息；判断所述语音信息中是否携带满足建模要求的预设关键词；在判断结果为是的情况下，从所述语音信息中截取出于对应于所述满足建模要求的预设关键词的语音片段；利用所述语音片段，为所述用户构建声纹模型。

【技术特征摘要】
1.一种用户声纹模型构建方法，其特征在于，该方法包括：接收用户输入的语音信息；判断所述语音信息中是否携带满足建模要求的预设关键词；在判断结果为是的情况下，从所述语音信息中截取出于对应于所述满足建模要求的预设关键词的语音片段；利用所述语音片段，为所述用户构建声纹模型。2.根据权利要求1所述的方法，其特征在于，所述判断所述语音信息中是否携带满足建模要求的预设关键词的步骤，包括：在当前已存在所述用户的声纹模型的情况下，判断所述语音信息中是否携带该声纹模型中未包含的预设关键词；或在当前已存在所述用户的声纹模型的情况下，判断所述语音信息中是否携带该声纹模型中已包含的预设关键词。3.根据权利要求1或2所述的方法，其特征在于，所述利用所述语音片段，为所述用户构建声纹模型的步骤，包括：在当前已存在所述用户的声纹模型的情况下，利用所述语音片段，对该声纹模型进行更新。4.根据权利要求1所述的方法，其特征在于，所述判断所述语音信息中是否携带满足建模要求的预设关键词的步骤，包括：利用声学模型对所述语音信息切分，得到至少1个语音片段；判断所得到的语音片段或其组合，是否与满足建模要求的预设关键词的音频特征相匹配，如果是，则确定所述语音信息中携带满足建模要求的预设关键词。5.根据权利要求1所述的方法，其特征在于，所述判断所述语音信息中是否携带满足建模要求的预设关键词的步骤，包括：对所述语音信息进行语音识别，得到对应的文本信息；利用语言模型对所述文本信息切分，得到至少1个文本片段；判断所得到的文本片段或其组合，是否与满足建模要求的预设关键词的文本内容相一致，如果是，则确定所述语音信息中携带满足建模要求的预设关键词。6.一种基于声纹的用户身份认证方法，其特征在于，该方法包括：接收用户输入的语音信息；判断所述语音信息中是否携带满足认证要求的预设关键词；在判断结果为是的情况下，从所述语音信息中截取出于对应于所述满足认证要求的预设关键词的语音片段；提取所述语音片段的声纹特征；利用所述声纹特征与预先构建的所述用户的声纹模型，对所述用户的身份进行认证。7.根据权利要求6所述的方法，其特征在于，还包括：判断所述语音信息中是否携带所述用户的声纹模型中未包含的预设关键词，在判断结果为是的情况下，从所述语音信息中截取出于对应于所述未包含的预设关键词的语音片段；利用所述对应于所述未包含的预设关键词的语音片段，对所述用户...

【专利技术属性】
技术研发人员：凌青，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人