【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及语音(音频)处理以及语音识别技术,另外涉及说话人对比、电话会议、以及数字网络视听的技术。
技术介绍
说话人识别技术对于许多应用,例如说话人跟踪、语音索引(audio index)、以及分段是非常有用的。近年来,提出了使用多个锚(说话人)模型对说话人进行建模的技术。将说话人语音投影到锚模型上,构成表示说话人的声学特性的向量。图1表示用于进行说话人识别的以往设备的方框图。如图1所示,通过学习来自多个普通说话人的语音,生成锚空间。在参考锚集合生成单元(reference anchor setgeneration unit)102中,从锚空间(anchor space)选择作为集群(cluster)的重心的多个虚拟锚说话人(virtual anchor speakers)并形成参考锚集合(reference anchor set),或者选择距各集群的重心最近的锚说话人并形成参考锚集合。前端101取得目标说话人的登记语音,将该登 记语音转换为特征参数,并将这些特征参数发送至声纹(voice print)生成单元103。声纹生成单元103基于从前端101发送来的特 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:沈海峰,马龙,张丙奇,
申请(专利权)人:松下电器产业株式会社,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。