【技术实现步骤摘要】
【国外来华专利技术】说话人识别系统中的注册
本文所描述的实施方案涉及说话人识别系统。
技术介绍
说话人识别系统越来越广泛地被使用。在这样的系统中,用户通过提供他们的话语的样本来进行注册,此被用于形成话语的模型,还被称为声纹(voiceprint)。然后,在后续的说话人识别尝试期间,将话语的样本与模型进行比较。可以将用户归类到“生物测定动物园(biometriczoo)”中的类别,以指示:(a)系统是否很容易将他们的后续话语输入识别为匹配他们的已注册样本;以及,(b)系统是否错误地将另外的人的话语样本识别为他们的已注册样本。
技术实现思路
现在已经认识到,通过仅当用户所提供的话语样本允许生成强声纹(strongvoiceprint)时才允许对用户进行注册,可以在说话人识别系统中避免对用户的一些错误接受和错误拒绝。根据本专利技术的一个方面,提供了一种在说话人识别系统中对用户进行注册的方法,该方法包括:接收所述用户的话语的样本;由所述用户的话语的样本生成试验声纹;获得与所述试验声纹有关的得分;以及仅当得分满足一预定标准时,才基于所述试验声纹对所述用户进行注册。根据本专利技术的另一方面,提供了一种用于在说话人识别系统中对用户进行注册的系统,该系统被配置用于根据所述方法操作。根据本专利技术的另一方面,提供了一种包括这种系统的设备。所述设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。根 ...
【技术保护点】
1.一种在说话人识别系统中对用户进行注册的方法,所述方法包括:/n接收所述用户的话语的样本;/n由所述用户的话语的样本生成试验声纹;/n获得与所述试验声纹有关的得分;以及/n仅当所述得分满足一预定标准时,才基于所述试验声纹对所述用户进行注册。/n
【技术特征摘要】
【国外来华专利技术】20180213 GB 1802309.3;20171114 US 62/585,6271.一种在说话人识别系统中对用户进行注册的方法,所述方法包括:
接收所述用户的话语的样本;
由所述用户的话语的样本生成试验声纹;
获得与所述试验声纹有关的得分;以及
仅当所述得分满足一预定标准时,才基于所述试验声纹对所述用户进行注册。
2.根据权利要求1所述的方法,其中获得与所述试验声纹有关的得分包括:
获得指示所述试验声纹与另外的声纹或话语样本之间的相似度的得分;以及
仅当所述得分满足一预定标准时,才基于所述试验声纹对所述用户进行注册。
3.根据权利要求2所述的方法,其中获得得分包括获得第一得分,所述第一得分指示先前所存储的另外的说话人的声纹或话语样本与所述试验声纹之间的相似度,且其中所述方法包括:
仅当所述第一得分低于第一阈值时,才基于所述试验声纹对所述用户进行注册。
4.根据权利要求3所述的方法,其中所述第一阈值对应于预定的错误接受率。
5.根据权利要求3所述的方法,还包括:
如果所述得分超过所述第一阈值,则请求所述用户提供他们的话语的第二样本且由所述第二样本生成新的试验声纹。
6.根据权利要求3所述的方法,还包括:
如果所述得分超过所述第一阈值,则由所接收的所述用户的话语的样本生成新的试验声纹。
7.根据权利要求3、4或5所述的方法,包括:
获得多个得分,所述得分中的每一得分指示相应的先前所存储的另一说话人的声纹或话语样本与所述试验声纹之间的相应的相似度;
确定所述多个得分中的哪个得分是最小值;以及
将所述多个得分中的最小值作为所述第一得分。
8.根据权利要求3、4或5所述的方法,包括:
获得多个得分,所述得分中的每一得分指示相应的先前所存储的另一说话人的声纹或话语样本与所述试验声纹之间的相应的相似度;
确定所述多个得分的平均值;以及
将所述多个得分的平均值作为所述第一得分。
9.根据权利要求3至8中的一项所述的方法,其中所述第一得分指示先前所存储的另外的说话人的选定群组的声纹或话语样本之间的相似度,且其中所述方法包括:
确定另外的说话人的多个群组中的哪个群组最接近所述试验声纹,且在获得所述第一得分时使用所述最接近的群组作为所述选定群组。
10.根据权利要求2所述的方法,包括由所述用户的话语的样本的至少一个区段生成所述试验声纹,
其中获得得分包括获得第二得分,所述第二得分指示所述用户的话语的样本的至少一个另外的区段与所述试验声纹之间的相似度,以及
其中所述方法包括:
仅当所述第二得分高于第二阈值时,才基于所述试验声纹对所述用户进行注册。
11.根据权利要求10所述的方法,其中所述第二阈值对应于预定的错误拒绝率。
12.根据权利要求10或11所述的方法,还包括:
如果所述得分不超过所述第二阈值,则请求所述用户提供他们的话语的第二样本且由所述第二样本生成新的试验声纹。
13.根据权利要求10或11所述的方法,还包括:
如果所述得分不超过所述第二阈值,则由所接收的所述用户的话语的样本生成新的试验声纹。
14.根据任一项前述权利要求所述的方法,包括:
接收所述用户的话语的样本;
将所述用户的话语的样本划分成多个区段;以及
基于所述多个区段的子集获得所述试验声纹。
15.根据权利要求14所述的方法,其中,选择言语中的一个言语的步骤包括:
基于所述多个区段中的全部区段来获得第二声纹;
对于所述多个区段中的每一区段,获得代表相应的区段与所述第二声纹之间的相似性的相应得分;
标识所述区段中与所述第二声纹具有最低相似性的一个区段;以及
基于将所述区段中被标识的区段排除在外的多个区段来获得所述试验声纹。
16.根据权利要求15所述的方法,包括重复如下步骤:获得第二声纹;获得代表相应的区段与所述第二声纹之间的相似性的相应得分;以及,标识所述区段中与所述第二声纹具有最低相似性的一个区段,之后获得所述试验声纹。
17.根据权利要求14所述的方法,其中选择言语中的一个言语的步骤包括:
获得多个第二声纹,每一第二声纹基于将所述言语中相应的一个言语排除在外的多个言语;
针对所述多个言语中的每一言语,基于将所述言语中相应的一个言语排除在外的多个言语,获得代表相应的言语与相应的第二声纹之间的相似性的相应得分;
标识所述言语中与所述相应的第二声纹具有最低相似性的一个言语;以及
使用基于将所述言语中被标识的一个言语排除在外的多...
【专利技术属性】
技术研发人员:J·P·莱索,B·霍普森,
申请(专利权)人:思睿逻辑国际半导体有限公司,
类型:发明
国别省市:英国;GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。