用于识别说话人的建模设备和方法、以及说话人识别系统技术方案

技术编号：8983406 阅读：197 留言：0更新日期：2013-08-01 02:14

本发明专利技术实现用于识别说话人的建模设备和方法、以及说话人识别系统。建模设备包括：前端，从各目标说话人取得登记语音数据；参考锚集合生成单元，基于锚空间使用登记语音数据生成参考锚集合；以及声纹生成单元，基于参考锚集合和登记语音数据生成声纹。在本公开中，通过考虑登记语音和说话人自适应技术，能够生成尺寸更小的锚模型，因而能够进行具有尺寸更小的参考锚集合的、可靠性高的鲁棒的说话人识别。这对于进行计算速度的改善以及大幅度的存储器削减是非常有利的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及语音(音频)处理以及语音识别技术，另外涉及说话人对比、电话会议、以及数字网络视听的技术。
技术介绍
说话人识别技术对于许多应用，例如说话人跟踪、语音索引(audio index)、以及分段是非常有用的。近年来，提出了使用多个锚(说话人)模型对说话人进行建模的技术。将说话人语音投影到锚模型上，构成表示说话人的声学特性的向量。图1表示用于进行说话人识别的以往设备的方框图。如图1所示，通过学习来自多个普通说话人的语音，生成锚空间。在参考锚集合生成单元(reference anchor setgeneration unit)102中，从锚空间(anchor space)选择作为集群(cluster)的重心的多个虚拟锚说话人(virtual anchor speakers)并形成参考锚集合(reference anchor set),或者选择距各集群的重心最近的锚说话人并形成参考锚集合。前端101取得目标说话人的登记语音，将该登记语音转换为特征参数，并将这些特征参数发送至声纹(voice print)生成单元103。声纹生成单元103基于从前端101发送来的特...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：沈海峰，马龙，张丙奇，
申请(专利权)人：松下电器产业株式会社，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人