用于与文本相关的说话者验证的双重评分方法及系统技术方案

技术编号:9463627 阅读:143 留言:0更新日期:2013-12-19 01:20
本发明专利技术提供说话者验证系统及方法。该方法包括接收说话者话语并响应话语确定与文本无关的说话者验证分数和与文本相关的说话者验证分数。还包括响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间关系来确定与UBM无关的说话者标准化分数,并且对于各话语将与UBM无关的说话者验证分数和与文本相关的说话者验证分数映射至二维分数空间,其分成与接受分数、不明确分数和拒绝分数对应的三个集群。用于说话者验证置信分数生成的二进制决策树被通过识别二进制决策树各节点的逻辑函数识别,并且通过在各节点处执行逻辑函数以对应于话语生成该置信分数,以将话语的与文本相关的说话者验证分数和与UBM无关的说话者验证分数映射到二进制决策。

【技术实现步骤摘要】
【专利摘要】本专利技术提供说话者验证系统及方法。该方法包括接收说话者话语并响应话语确定与文本无关的说话者验证分数和与文本相关的说话者验证分数。还包括响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间关系来确定与UBM无关的说话者标准化分数,并且对于各话语将与UBM无关的说话者验证分数和与文本相关的说话者验证分数映射至二维分数空间,其分成与接受分数、不明确分数和拒绝分数对应的三个集群。用于说话者验证置信分数生成的二进制决策树被通过识别二进制决策树各节点的逻辑函数识别,并且通过在各节点处执行逻辑函数以对应于话语生成该置信分数,以将话语的与文本相关的说话者验证分数和与UBM无关的说话者验证分数映射到二进制决策。【专利说明】用干与文本相关的说话者验证的双重评分方法及系统优先权要求本申请要求2012年5月31日提交的第201204003-6号新加坡专利申请的优先权。
本专利技术通常涉及说话者验证,更具体地是涉及用干与文本相关的说话者验证的系统及方法。
技术介绍
说话者验证或说话者认证(亦称为“语音生物測定”)是包括通过使用他/她声音中固有的显著特征来接受或拒绝说话者的身份请求的ニ进制分类任务。很多因素可能会约束说话者验证系统。尤其是说话者之间和自身的可变性以及渠道影响严重影响语音验证系统的精度。此外,对于现实应用中人体工程学的使用,通常需要关于登记和测试语音材料的持续时间约束。遗憾的是,当处理短于十秒的语音话语时,在不受约束的条件下已经证明其效能的目前说话者识别引擎显示出了其局限性。自动身份验证引擎的执行也遭受真实欺诈。对于语音生物測定的情况,其主要包括回放在客户不知情的情况下从客户处获取的录曰? 因此,需要一种用于说话者验证的系统及方法,以克服现有技术的这些缺点。此外,结合附图及该
技术介绍
中,根据通过以下详细描述和权利要求,其它期望的特点和特征将是显而易见的。
技术实现思路
根据【具体实施方式】,提供了一种说话者验证方法。该方法包括:接收说话者的话语,响应于该话语,确定与文本无关的说话者验证分数和与文本相关的说话者验证分数。该方法还包括:响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间的关系,确定与UBM无关的说话者标准化分数,以及响应于与UBM无关的说话者标准化分数,确定说话者验证。根据另一方面,提供了一种与用背景模型(UBM)无关的说话者验证方法。该方法包括:接收说话者的话语,响应于该语,确定与文本无关的说话者验证分数和与文本相关的说话者验证分数。最后,该方法包括:响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间的关系,确定与UBM无关的说话者标准化分数,以及响应于与UBM无关的说话者标准化分数,确定说话者验证。根据又一方面,提供了一种双重评分的与文本相关的说话者验证方法。该方法包括:接收多个测试话语,响应于多个话语的每个,确定与文本无关的说话者验证分数,并响应于多个话语的每个,确定与文本相关的说话者验证分数。该方法还包括:响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间的关系,确定与UBM无关的说话者标准化分数,并且对于多个话语的每个,将与UBM无关的说话者标准化分数和与文本相关的说话者验证分数映射在ニ维分数空间中。该方法还包括:将ニ维分数空间分为三个集群,该三个集群对应于接受分数、不明确分数以及拒绝分数。最后,该方法包括:通过确定ニ进制决策树的每个节点处的逻辑函数,来定义用于说话者验证置信分数的生成的ニ进制决策树。并且,根据又一方面,提供了一种用于说话者验证的系统。该系统包括:音频接收设备和处理器。音频接收设备接收说话者的话语,并将话语转换为话语信号。处理器耦合到音频接收设备,以响应于话语信号来确定说话者验证。通过响应于话语信号来确定与文本无关的说话者验证分数和与文本相关的说话者验证分数、以及响应于与文本相关的说话者验证分数和与文本无关的说话者验证分数之间的关系来确定与UBM无关的说话者标准化分数,该处理器响应于与UBM无关的说话者标准化分数来确定说话者验证。附图简要说明在附图中,在各个附图中相同的附图标记表示相同的或功能相似的部分,附图与以下的详细描述一同并入说明书并且成为说明书的一部分,用于示出各种实施方式以及解释根据本实施方式的各种原理及优点。图1是示出根据本实施方式的用于双重评分说话者验证系统的分级多层声学模型(HiLAM)体系结构的示意图。图2示出根据利用图1体系结构的实施方式的示例性双重评分说话者验证系统,其中,图2A是示出示例性系统的示意图,图2B是示出根据本实施方式执行双重评分说话者验证的系统中的处理器的流程图。图3包括图3A、3B、3C以及3D,示出根据本实施方式通过图1的HiLAM说话者验证引擎得到的与文本无关及与文本相关分数的分布图,其中,图3A是说出正确密码短语的目标说话者的图表,图3B是说出错误密码短语的目标说话者的图表,图3C是说出正确密码短语的冒充者的图表,图3D是说出错误密码短语的冒充者的图表。图4示出按照在具有或没有用于不同类型测试的相同声学模型上的左右约束的情况下由图1的HiLAM说话者验证引擎实施的维特比对准的百分比,分配到相同状态的帧的分布图。图5包括图5A和5B,示出根据图1的HiLAM说话者验证引擎的评分的图,其中,图5A示出UBM标准化的与文本相关的评分的图,图5B示出说话者标准化的与文本相关的评分的图。图6包括图6A和6B,示出根据图1的HiLAM说话者验证引擎的评分的图,其中,图6A示出UBM标准化的与文本相关的评分的图,图6B示出说话者标准化的与文本相关的评分的图。图7包括图7A、7B以及7C,示出使用决策树实施的软决策边缘系统,其中,图7A是文字化决策树,图7B是形象化决策树,图7C是图形化决策树。图8示出通过逻辑函数将双重分数映射到单个置信分数。本领域的技术人员应当理解,为了简单清楚起见,图中所示元件并没有按照比例绘制。例如,为了有助于本专利技术的理解,示意图或流程图中的某些部分相对于其他部分,其尺寸可能被放大。【具体实施方式】下文中的详细描述在本质上仅为示例性的,并不意在限定本专利技术或本专利技术应用及使用。此外,也不意在受到本专利技术的
技术介绍
或下文中的详细描述提出的任何理论的约束。本专利技术的目的在于提供一种说话者验证系统及方法,以显著地改进影响商务说话者验证引擎的主要递降系数的两个,即持续时间约束和欺诈攻击。要求说话者说出特定话语是约束条件之一,其因短的讲话时间而可以轻易地維持性能。大量的与文本有关的说话者识别方法已经被提出以应对短的持续时间。文本相关性还可以通过验证必须说出随机提示文本的说话者是否活着,来帮助防止录音回放欺诈。多层声学体系结构已经被提出,其源自公知的GMM/UBM (高斯混合模型(GaussianMixture Model) /通用背景模型(Universal Background Model))框架,该框架允许同时执行与文本无关和与文本有关的验证。因此,根据本实施方式,本文中将描述使用称为分级多层声学模型(Hierarchical mult1-Layer Acoustic Model (HiLAM))的三层体系结构和新的说话者特定的分数标准化方法的新分数计本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201310214139.html" title="用于与文本相关的说话者验证的双重评分方法及系统原文来自X技术">用于与文本相关的说话者验证的双重评分方法及系统</a>

【技术保护点】
一种说话者验证方法,包括:接收说话者的话语;响应于所述话语,来确定与文本无关的说话者验证分数;响应于所述话语,来确定与文本相关的说话者验证分数;响应于所述与文本相关的说话者验证分数与所述与文本无关的说话者验证分数之间的关系,来确定与通用背景模型(UBM)无关的说话者标准化分数;以及响应于所述与通用背景模型无关的说话者标准化分数,来确定说话者验证。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:安东尼·拉尔彻李功益马斌蔡玉翠香
申请(专利权)人:新加坡科技研究局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利