【技术实现步骤摘要】
【国外来华专利技术】说话者验证背景说话者验证是基于语音信号检验说话者声明身份的过程。验证通常使用已 经为使用系统的每个人进行过训练的语音模型来执行。通常存在有两类说话者验证,即独立于文本和依赖于文本。在独立于文本 的说话者验证中,说话者提供他们想要提供的任何语音内容。在依赖于文本的 说话者验证中,说话者在模型训练和验证系统使用期间朗读一特定短语。通过 重复相同短语,就可以构造用于文本依赖说话者验证系统的语音单位和这些语 音单位之间过渡的强模型。而在文本独立说话者验证系统中则不是这样,因为 许多语音单位和语音单位之间的许多过渡将不会在训练期间被观察到,于是将 不会在模型中良好表示。以上讨论仅提供一般背景信息,并不旨在帮助确定权利要求的主题的范围。概述说话者验证通过确定测试发言和存储的训练发言的相似性得分来执行。计 算相似性得分涉及确定一组函数之和,其中每个函数包括混合成分的后验概率 与适应均值和背景均值间差异之积。适应均值是基于背景均值和测试发言形成 的。提供本概述以便以简化形式介绍将在以下详细描述中进一步描述的一些 概念。本概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在 用于帮助确定所要求保护的主题的范围。所要求保护的主题不限于解决任何或 所有在背景中提及缺点的实现。附图简述附图说明图1是可在其中实践一些实施例的一个计算环境的框图。图2是可在其中实践一些实施例的可选计算环境的框图。 图3是一种训练文本独立验证系统的方法的流程图。图4是用于训练文本独立验证系统的各元素的框图。 图5是一种用于在训练期间设置阈值的方法的流程图。 图6是一种标识测试发言的模型参数的流程图 ...
【技术保护点】
一种方法,包括: 接收(600)语音信号(700); 基于所述语音信号(700)通过适应包括针对多个混合分量中每一分量的背景均值的背景模型(412)来形成(604)针对所述多个混合分量中每一分量的适应均值(714); 通过确定为所述多个混合分量确定的函数之和来确定(906)相似性得分(1012),其中每个函数包括基于所述语音信号的混合分量后验概率与适应均值(714)和背景均值(412)之差的积。
【技术特征摘要】
【国外来华专利技术】US 2006-2-20 11/358,3021. 一种方法,包括接收(600)语音信号(700);基于所述语音信号(700)通过适应包括针对多个混合分量中每一分量的背景均值的背景模型(412)来形成(604)针对所述多个混合分量中每一分量的适应均值(714);通过确定为所述多个混合分量确定的函数之和来确定(906)相似性得分(1012),其中每个函数包括基于所述语音信号的混合分量后验概率与适应均值(714)和背景均值(412)之差的积。2. 如权利要求1所述的方法,其特征在于,还包括基于来自用户的训练 语音信号(420)通过适应(312)所述背景模型来形成(312)针对所述多个 混合分量中每一分量的训练均值。3. 如权利要求2所述的方法,其特征在于,每个函数还包括基于所述训 练语音信号的混合分量后验概率与训练均值和背景均值之差的积。4. 如权利要求3所述的方法,其特征在于,还包括接收(900)名义用户 标识(1000)并且基于所述名义用户标识选择(902)供所述函数使用的训练 均值(1002)。5. 如权利要求1所述的方法,其特征在于,还包括为说话者池(400)内 多个说话者中的每个说话者形成(306)说话者池均值(418),针对一说话者 的所述说话者池均值是基于来自所述说话者的语音通过适应背景模型而形成 的。6. 如权利要求5所述的方法,其特征在于,每个函数还包括相应的阈值, 其中每个阈值(722)是基于针对所述说话者池中一说话者子集的说话者池均 值(720)。7. 如权利要求6所述的方法,其特征在于,还包括基于由所述说话者池 均值(418)和所述适应均值(714)确定的相似性得分来从所述说话者池中选 择(800)所述说话者子集。8. 如权利要求7所述的方法,其特征在于,还包括基于来自用户的训练语音信号(420)通过适应(312)所述背景模型来形 成(312)针对所述多个混合分量中每一分量的训练均值(426);以及基于针对所述说话者池中第二所述说话者子集的说话者池均值来确定 (314)名义用户标识(436),所述第二子集是基于由所述说话者池均值和所 述训练均值确定的相似性得分从所述说话者池中选择(502)的。9. 如权利要求8所述的方法,其特征在于,每个函数还包括第二阈值。10. —种具有用于执行以下步骤的计算机可执行指令的计算机可读介质 确定(800)测试发言(714)与一组训练发言集合(418)中的每一发言之间的相似性得分;使用(800)所述相似性得分选择所述一组训练发言集合的一个子集(720);使用训练发言的所述子集(720)来定义阈值(724);以及使用(906)所述阈值来确定所述测试发言和一存储的用户发言之间的验证相似性得分。11. 如权利要求IO所述的计算机可读介质,其特征在于,确定(906)相 似性得分包括基于所述测试发言适应(604)背景模型以形成适应均值并在所 述相似性得分中使用(906)所述适应均值。12. 如权利要求ll所述的计算机可读介质,其特征在于,使用(906)所 述适应均值包括确定所述适应均值和所述背景模型的背景均值之差并使用所 述差来确定所述相似性得分。13. 如权利要求12所述的计算机可读介质,其特征在于,确定所述相似 性...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。