用于促进可靠样式检测的方法和系统技术方案

技术编号:19024895 阅读:24 留言:0更新日期:2018-09-26 19:26
根据本公开的第一方面,构想一种用于促进一个或多个时间序列样式的检测的方法,包括构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。根据本公开的第二方面,提供一种对应计算机程序。根据本公开的第三方面,提供一种用于促进一个或多个时间序列样式的检测的对应系统。

【技术实现步骤摘要】
用于促进可靠样式检测的方法和系统
本公开涉及一种用于促进一个或多个时间序列样式的检测的方法。此外,本公开涉及一种对应计算机程序和一种对应系统。
技术介绍
时间序列样式是遍及连续时间间隔从跨越所述间隔的连续测量当中产生的数据点的样式,所述产生是使用每两个相继测量之间的相等间距而进行且其中所述时间间隔内的每个时间单位具有至多一个数据点。时间序列样式的例子是音频样式,例如声音样式和人类语音样式。可有用的是检测特定时间序列样式,例如以便辨识特定事件或情境(例如,启动汽车或存在于运行的汽车中)且区分和识别不同的说话者。此外,可有用的是使此类检测较容易且较可靠。
技术实现思路
根据本公开的第一方面,构想一种用于促进一个或多个时间序列样式的检测的方法,所述方法包括构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。在一个或多个实施例中,所述人工神经网络中的所述特定一个人工神经网络包括决策输出单元和可靠性输出单元,其中所述决策输出单元被配置成产生所述决策输出,且其中所述可靠性输出单元被配置成产生所述可靠性输出。在一个或多个实施例中,所述人工神经网络中的所述特定一个人工神经网络被配置成基于所述可靠性输出而向所述决策输出指派权重。在一个或多个实施例中,所述人工神经网络中的所述特定一个人工神经网络被配置成基于所述可靠性输出而忽略所述决策输出。在一个或多个实施例中,构建所述人工神经网络包括采用增广拓扑神经进化。在一个或多个实施例中,存储所述人工神经网络以用于检测任务中的后续使用。在一个或多个实施例中,待检测的每个时间序列样式表示所述检测任务的类别。在一个或多个实施例中,所述时间序列样式是音频样式。在一个或多个实施例中,提供原始时间序列信号作为对所构建的每个人工神经网络的输入。在一个或多个实施例中,所述音频样式包括以下各项的群组中的至少一个:有声语音、无声语音、用户特定语音、情境声音、声音事件。在一个或多个实施例中,所述时间序列样式的所述检测形成说话者认证功能的部分。在一个或多个实施例中,对于待认证的每个说话者,构建至少一个人工神经网络以用于检测所述说话者的语音片段。在一个或多个实施例中,对于待认证的每个说话者,构建人工神经网络以用于检测所述说话者的有声语音片段,且构建另一人工神经网络以用于检测所述说话者的无声语音片段。根据本公开的第二方面,提供一种计算机程序,所述计算机程序包括非暂时性指令,所述非暂时性指令在执行时实行或控制所阐述的种类的方法。根据本公开的第三方面,提供一种用于促进一个或多个时间序列样式的检测的系统,所述系统包括网络构建单元,所述网络构建单元被配置成构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,所述网络构建单元被配置成构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。附图说明将参考附图来更详细地描述实施例,在附图中:图1示出样式检测促进方法的说明性实施例;图2示出样式检测促进方法的另一说明性实施例;图3示出样式检测促进系统的说明性实施例;图4示出样式检测系统的说明性实施例;图5(A)到(C)示出人工神经网络的说明性实施例;图6示出人工神经网络的另一说明性实施例;图7示出人工神经网络的另外说明性实施例。具体实施方式如上文所提及,可有用的是使时间序列样式的检测较容易且较可靠。举例来说,为了辨识特定音频事件或情境且区分和识别不同的说话者,可能有必要检测音频信号中的特定时间序列样式。这应以可靠方式而完成以避免错误识别。在例子中,在对输入信号分类之前根据输入信号计算一组特征。所谓的梅尔频率倒谱系数(Mel-FrequencyCepstralCoefficient;MFCC)是此类特征的例子。接着,将所提取的特征提供到执行分类任务的分类器。特征的提取会减少输入维数,这又会促进分类任务。然而,减少输入维数也可能会负面地影响样式检测过程。举例来说,在说话者认证任务的状况下,无论目标说话者是谁,都提取同一组特征。这会妨碍捕获对于给定说话者极为特定的特性,这又可能会引起错误识别。根据本公开,构建对于对应于目标说话者的时间序列样式为特定的人工神经网络(ANN)会促进捕获对于所述说话者为特定的特性。具体地说,随后可将特定ANN用作分类器,分类器可接收输入信号(例如,尚未由特征提取器预处理的原始输入信号),且可检测所述信号内的对应于目标说话者的时间序列样式。应注意,可至少部分地由计算机程序以如本文中作为例子而描述的方式构建ANN。本专利技术人已发现,本专利技术所公开的方法和对应系统尤其适合于促进音频样式的检测;然而,它们的应用并不限于此情形。此外,根据本公开,使ANN进化,使得其产生决策输出和可靠性输出,其中可靠性输出指示决策输出的可靠性。在实用且高效的实施方案中,ANN包括决策输出单元和可靠性输出单元。在那种状况下,决策输出单元被配置成产生决策输出,且可靠性输出单元被配置成产生可靠性输出。决策输出表示检测决策,例如指示当前时间序列输入与目标样式匹配的程度或范围的值。可靠性输出指示决策输出的可靠度。换句话说,可靠性输出指示决策输出对于检测任务中的实际使用的合适度。因此,可靠性输出可被称为可靠性指示符。举例来说,可以设想,音频样式的一些样本相比于其它样本更适合用于说话者认证任务。举例来说,包含有声片段的输入样本-即,像元音一样的-很可能是合适的,这是因为不同的说话者以极其不同的方式说出这些声音。与此对比,包含静默时段的输入样本很可能较不适合用于说话者认证任务。根据本公开,使ANN进化,其目的是指示输出样本的可靠性的不同程度。在此例子中,进化的ANN将在有声输入和静默两者期间输出检测决策和可靠性指示符。在有声输入期间,ANN可输出具有高值的可靠性指示符,这是因为ANN的输出在那一时刻可能高度地可靠。在静默期间,ANN可输出具有低值的可靠性指示符,这是因为ANN的输出在那一时刻可能不可靠。举例来说,这些可靠性指示符可用以向相应检测决策指派权重。因此,在一个或多个实施例中,ANN被配置成基于可靠性输出而向决策输出指派权重。而且,可靠性指示符可用于忽略不合适的输出样本。因此,在一个或多个实施例中,ANN被配置成基于可靠性输出而忽略决策输出。这些可靠性输出允许使始终无需输出可靠决策的网络进化。应强调,留待进化过程来构建可靠性输出的行为。以上例子仅是此行为对于说话者认证任务可以是什么的设想。图1示出样式检测促进方法100的说明性实施例。方法100包括:在102处,选择待检测的时间序列样式。举例来说,选定时间序列样式可以是音频样式,尤其是用户特定语音、有声语音(元音)、无声语音(辅音)、情境声音(例如,运行的汽车)或声音事件(例如,启动汽车)。此外,方法100包括:在104处,对于选定时间序列样式构建ANN。如上文所提及,ANN被配置成产生至少两个输出;可靠性输出指示决策输出的可靠性。接着,在106处,检查是否应检测更多时间序列样本文档来自技高网...

【技术保护点】
1.一种用于促进一个或多个时间序列样式的检测的方法,其特征在于,包括构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。

【技术特征摘要】
2017.03.08 EP 17305247.31.一种用于促进一个或多个时间序列样式的检测的方法,其特征在于,包括构建一个或多个人工神经网络,其中,对于待检测的至少一个时间序列样式,构建所述人工神经网络中的特定一个人工神经网络,所述人工神经网络中的所述特定一个人工神经网络被配置成产生决策输出和可靠性输出,其中所述可靠性输出指示所述决策输出的可靠性。2.根据权利要求1所述的方法,其特征在于,所述人工神经网络中的所述特定一个人工神经网络包括决策输出单元和可靠性输出单元,其中所述决策输出单元被配置成产生所述决策输出,且其中所述可靠性输出单元被配置成产生所述可靠性输出。3.根据权利要求1或2所述的方法,其特征在于,所述人工神经网络中的所述特定一个人工神经网络被配置成基于所述可靠性输出而向所述决策输出指派权重。4.根据在前的任一项权利要求所述的方法,其特征在于,所述人工神经网络中的所述特定一个人工神经网络被配置成基于所述可靠性输出而忽略所述决策输出。5.根据在...

【专利技术属性】
技术研发人员:阿德里安·丹尼尔
申请(专利权)人:恩智浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1