用于识别说话人的建模设备和方法、以及说话人识别系统技术方案

技术编号:8983406 阅读:197 留言:0更新日期:2013-08-01 02:14
本发明专利技术实现用于识别说话人的建模设备和方法、以及说话人识别系统。建模设备包括:前端,从各目标说话人取得登记语音数据;参考锚集合生成单元,基于锚空间使用登记语音数据生成参考锚集合;以及声纹生成单元,基于参考锚集合和登记语音数据生成声纹。在本公开中,通过考虑登记语音和说话人自适应技术,能够生成尺寸更小的锚模型,因而能够进行具有尺寸更小的参考锚集合的、可靠性高的鲁棒的说话人识别。这对于进行计算速度的改善以及大幅度的存储器削减是非常有利的。

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及语音(音频)处理以及语音识别技术,另外涉及说话人对比、电话会议、以及数字网络视听的技术。
技术介绍
说话人识别技术对于许多应用,例如说话人跟踪、语音索引(audio index)、以及分段是非常有用的。近年来,提出了使用多个锚(说话人)模型对说话人进行建模的技术。将说话人语音投影到锚模型上,构成表示说话人的声学特性的向量。图1表示用于进行说话人识别的以往设备的方框图。如图1所示,通过学习来自多个普通说话人的语音,生成锚空间。在参考锚集合生成单元(reference anchor setgeneration unit)102中,从锚空间(anchor space)选择作为集群(cluster)的重心的多个虚拟锚说话人(virtual anchor speakers)并形成参考锚集合(reference anchor set),或者选择距各集群的重心最近的锚说话人并形成参考锚集合。前端101取得目标说话人的登记语音,将该登 记语音转换为特征参数,并将这些特征参数发送至声纹(voice print)生成单元103。声纹生成单元103基于从前端101发送来的特征参数以及由参考锚集本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:沈海峰马龙张丙奇
申请(专利权)人:松下电器产业株式会社
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1