说话人注册制造技术

技术编号:24694023 阅读:69 留言:0更新日期:2020-06-27 12:50
一种用于说话人识别系统的说话人建模方法,包括:接收包括说话人的话语的信号;以及,针对所述信号的多个帧:获得所述说话人的话语的频谱;通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱;以及,从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征。该方法还包括基于所提取的特征来形成至少一个话语模型。

Speaker registration

【技术实现步骤摘要】
【国外来华专利技术】说话人注册
本文所描述的实施方案涉及例如在说话人识别系统中用于说话人注册的方法和设备。
技术介绍
说话人识别系统是已知的,其中用户能够向系统提供口语输入,例如以控制系统的某一方面的操作。为了提供一定程度的安全性,系统尝试验证说话人是被授权向系统提供该输入的人。在本文中,这被称为说话人识别,所述说话人识别可以包括:说话人辨认,其中系统尝试确定若干已注册用户中的哪一个正在说话;以及,说话人验证,其中系统尝试确定说话人是否是他们声称的那个人。说话人识别的过程通常要求用户在首次使用系统之前应该在系统中注册。注册要求用户说一些单词或短语,然后系统获得用户的话语的模型。在系统的后续使用中,将任何口语输入与已注册用户的话语的模型比较,以验证说话人是否为已注册用户。此过程的一个问题是,说话人的语音的属性可能会变化。例如,用户通常将通过选择在条件看起来良好时(例如,存在相对低水平的背景噪声时)讲话来在系统中注册。但是,在使用中,条件可能不太好。例如,可能存在高水平的背景噪声,或者用户可能位于距包含说话人识别系统的设备某一距离的位置。这些因素通常将意味着,用户将在他们的语音产生中使用较高水平的发声力度(vocaleffort),而此较高水平的发声力度往往会改变用户的话语的一些特性。除了附加噪声或混响的任何不利影响之外,发声力度的改变也是远场话语造成的。
技术实现思路
根据本专利技术的一方面,提供了一种用于说话人识别系统的说话人建模的方法。该方法包括接收包括说话人的话语的信号。针对该信号的多个帧,获得所述说话人的话语的频谱,通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱,以及从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征。基于所提取的特征形成至少一个话语模型。针对包含浊音话语的信号的多个帧,可以获得所述说话人的话语的频谱。所述帧可能重叠。每一帧可能具有10ms和50ms之间的持续时间。该方法可以包括通过施加与相应的发声力度有关的影响来生成多个经修改的频谱。生成至少一个经修改的频谱的步骤可以包括:确定所述说话人的话语的至少一个共振峰分量的频率和带宽;通过修改该共振峰分量或每一共振峰分量的频率和带宽中的至少一个来生成至少一个经修改的共振峰分量;以及,由该经修改的共振峰分量或每一经修改的共振峰分量生成经修改的频谱。该方法可以包括确定所述说话人的话语的处于3-5个范围内的共振峰分量的频率和带宽。生成经修改的共振峰分量可以包括修改该共振峰分量或每一共振峰分量的频率和带宽。从用户的话语的频谱中所提取的特征可以包括梅尔频率倒谱系数。形成至少一个话语模型的步骤可以包括形成说话人的话语的模型,然后可以在所述说话人识别系统中对所述说话人进行注册时执行该方法。形成至少一个话语模型的步骤可以包括部分地基于所述说话人的话语来形成用于所述说话人识别系统的背景模型。根据本专利技术的另一方面,提供了一种用于说话人识别系统的说话人建模的系统,该系统被配置用于执行根据第一方面的方法。在那种情况下,该系统可以包括:输入,用于接收包括说话人的话语的信号;以及,处理器,被配置用于针对该信号的多个帧:获得所述说话人的话语的频谱;通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱;从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征;以及,基于所提取的特征形成至少一个话语模型。根据本专利技术的另一方面,提供了一种包括这种系统的设备。该设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。根据本专利技术的另一方面,提供了一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据第一方面的方法的指令。根据本专利技术的另一方面,提供了一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据第一方面的方法。附图说明为了更好地理解本专利技术,且为了示出如何实施本专利技术,现在将参考附图,在附图中:图1例示了一个智能电话;图2是例示智能电话的形式的示意图;图3是例示说话人注册的方法的流程图;以及图4例示了用于说话人注册的系统。具体实施方式下面的描述阐述了根据此公开内容的示例实施方案。对于本领域普通技术人员而言,其他示例实施方案和实施方式将是显而易见的。此外,本领域普通技术人员将认识到,可以代替下面所讨论的实施方案或与下面所讨论的实施方案结合地应用多种等同技术,且所有这样的等同物应被认为是本公开内容所涵盖的。图1例示了一个智能电话10,该智能电话10具有一个或多个用于检测周边声音的麦克风12。在正常使用中,麦克风当然用于检测握持智能电话10的用户的话语。尽管本文所描述的方法的例示性实施例被实施在智能电话中,但是该方法可以被实施在任何合适的设备中。图2是例示智能电话10的形式的示意图。具体地,图2示出了设备(在这种情况下为智能电话10)的多个互连部件。应理解,智能电话10实际上将包含许多其他部件,但是以下描述对于理解本专利技术是足够的。因此,图2示出了上面所提及的麦克风12。在某些实施方案中,智能电话10设置有多个麦克风12、12a、12b等。在此情况下,系统可以选择由这些麦克风中的仅一个麦克风所生成的信号。替代地,可以组合由多个麦克风所生成的信号,以形成单个输入信号。图2还示出了存储器14,该存储器14实际上可以被设置为单个部件或多个部件。存储器14被设置用于存储数据和程序指令。图2还示出了处理器16,该处理器16实际上也可以被设置为单个部件或多个部件。例如,处理器16的一个部件可以是智能电话10的应用处理器。图2还示出了收发器18,该收发器18被设置用于允许智能电话10与外部网络通信。例如,收发器18可以包括用于经由WiFi局域网或经由蜂窝网络建立互联网连接的电路系统。图2还示出了音频处理电路系统20,用于根据需要对由麦克风12所检测到的音频信号执行操作。例如,音频处理电路系统20可以对音频信号进行滤波,或可执行其他信号处理操作。在此实施方案中,智能电话10设置有语音生物测定功能且设置有控制功能。因此,智能电话10能够响应于来自已注册用户的口语命令来执行多种功能。生物测定功能能够在来自已注册用户的口语命令和由一个不同的人所说出的相同命令之间进行区分。因此,本专利技术的某些实施方案涉及操作智能电话或具有某种语音可操作性的另一便携式电子设备,例如平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统、家用电器等,其中在旨在执行口语命令的设备中执行语音生物测定功能。某些其他实施方案涉及在智能电话或其他设备上执行语音生物测定功能的系统,如果语音生物测定功能能够确认说话人是已注册用户,则智能电话或其他设备将命令发送至一个分立的设备本文档来自技高网...

【技术保护点】
1.一种用于说话人识别系统的说话人建模的方法,包括:/n接收包括说话人的话语的信号;以及/n对于该信号的多个帧:/n获得所述说话人的话语的频谱;/n通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱;以及/n从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征;以及/n进一步包括:/n基于所提取的特征形成至少一个话语模型。/n

【技术特征摘要】
【国外来华专利技术】20180201 GB 1801657.6;20171121 US 62/589,0331.一种用于说话人识别系统的说话人建模的方法,包括:
接收包括说话人的话语的信号;以及
对于该信号的多个帧:
获得所述说话人的话语的频谱;
通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱;以及
从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征;以及
进一步包括:
基于所提取的特征形成至少一个话语模型。


2.根据权利要求1所述的方法,包括:
对于包含浊音话语的信号的多个帧,获得所述说话人的话语的频谱。


3.根据权利要求1或2所述的方法,包括:
对于所述信号的多个重叠帧,获得所述说话人的话语的频谱。


4.根据权利要求1、2或3所述的方法,其中每一帧具有10ms和50ms之间的持续时间。


5.根据权利要求1至4中的一项所述的方法,包括:
通过施加与相应的发声力度有关的影响来生成多个经修改的频谱。


6.根据任一项前述权利要求所述的方法,其中生成至少一个经修改的频谱的步骤包括:
确定所述说话人的话语的至少一个共振峰分量的频率和带宽;
通过修改该共振峰分量或每一共振峰分量的频率和带宽中的至少一个来生成至少一个经修改的共振峰分量;以及
由该经修改的共振峰分量或每一经修改的共振峰分量生成经修改的频谱。


7.根据权利要求6所述的方法,包括确定所述说话人的话语中处于3-5个范围内的共振峰分量的频率和带宽。


8.根据权利要求6或7所述的方法,其中生成经修改的共振峰分量包括:
修改该共振峰分量或每一共振峰分量的频率和带宽。


9.根据任...

【专利技术属性】
技术研发人员:R·赛义迪
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1