用于使用循环模型执行识别和训练循环模型的方法和设备技术

技术编号:18351349 阅读:28 留言:0更新日期:2018-07-02 01:12
公开一种用于使用循环模型执行识别和训练循环模型的方法和设备。一种识别方法包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。

【技术实现步骤摘要】
用于使用循环模型执行识别和训练循环模型的方法和设备本申请要求于2016年12月14日提交到韩国知识产权局的第10-2016-0170198号韩国专利申请的权益,该韩国专利申请的全部公开出于所有目的通过引用包含于此。
下面的描述涉及用于基于循环模型执行识别的技术和用于训练循环模型的技术。
技术介绍
近来,为了分类人机输入模式,已经进行了关于将有效的人类的模式识别方法应用到实际计算机的积极研究。一个这样的研究领域集中在通过数学表达式对人类的生物神经细胞的特性建模的人工神经网络。为了分类输入模式,人工神经网络采用模拟人类的学习能力的算法。使用这种算法,人工神经网络产生输入模式与输出模式之间的映射。产生这样的映射的能力被称为人工神经网络的学习能力。基于学习结果,人工神经网络针对未曾用于学习的输入模式产生输出。
技术实现思路
提供本
技术实现思路
从而以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在标识所要求保护的主题的关键特征或必要特征,也不意在用于帮助确定所要求保护的主题的范围。在一个总体方面,一种识别方法包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。所述识别方法还可包括:暂时存储与当前窗的最后帧对应的状态参数,以用于后续窗。所述识别方法可还包括:排除与填充相关联的状态参数和基于循环模型计算的填充数据的输出数据。计算识别结果的步骤可包括:以当前窗的窗长度和填充长度展开循环模型;针对每个帧将状态参数、提取的目标数据和提取的填充数据输入到展开的循环模型,并计算与包括在当前窗中的帧对应的输出数据。计算识别结果的步骤可包括:基于与先前窗的最后帧对应的状态参数,更新与当前窗的第一帧对应的节点的输入值。提取目标数据和填充数据的步骤可包括:从先前窗的最后帧数据之后的帧数据开始从序列数据提取与窗长度对应的数据作为与当前窗对应的目标数据。提取目标数据和填充数据的步骤可包括:从当前窗的最后帧数据之后的帧数据开始从序列数据提取与填充长度对应的数据作为与填充对应的填充数据。循环模型可以是被训练为响应于基于训练数据的训练输入输出训练输出的双向循环神经网络。循环模型可包括:与包括在窗和填充中的每个帧对应的节点;计算识别结果的步骤可包括:基于所述节点的前向通路,顺序地从窗的第一帧到窗的最后帧更新状态参数;基于所述节点的反向通路,顺序地从窗的最后帧到窗的第一帧更新状态参数;将基于前向通路的状态参数和基于反向通路的状态参数提供给后续层的节点。序列数据可对应于语音信号;计算识别结果的步骤可包括:从与当前窗对应的目标数据辨识发音。获取与先前窗对应的状态参数的步骤可包括:响应于当前窗是相对于序列数据的第一窗,将与先前窗对应的状态参数确定为默认值。提取目标数据和填充数据的步骤可包括:响应于当前窗是相对于序列数据的最后窗,排除填充数据。在另一总体方面,一种非暂时性计算机可读介质存储指令,当所述指令由处理器执行时,使所述处理器执行上述识别方法。在另一总体方面,一种识别设备包括:存储器,被配置为存储循环模型;处理器,被配置为:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。在另一总体方面,一种训练方法包括:获取循环模型;从训练输入提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;训练循环模型,使得映射到训练输入的训练输出基于状态参数、提取的目标数据和提取的填充数据被计算。所述训练方法还可包括:响应于训练输入中存在与后续窗对应的数据,暂时存储与当前窗的最后帧对应的状态参数,以用于基于后续窗的训练数据进行的训练。所述训练方法还可包括:排除与使用循环模型基于与填充相关联的状态参数计算的与填充相关联的输出数据。训练的步骤可包括:基于与先前窗的最后帧对应的状态参数,更新与当前窗的第一帧对应的节点的状态参数。获取与先前窗对应的状态参数的步骤可包括:响应于当前窗是相对于训练输入的第一窗,将与先前窗对应的状态参数确定为默认值。提取目标数据和填充数据的步骤可包括:响应于当前窗是相对于训练输入的最后窗,排除填充数据。在另一总体方面,一种识别方法包括:从序列数据提取与当前窗对应的目标数据;获取与序列数据中在当前窗之前的数据对应的过去背景数据;获取与序列数据中在当前窗之后的数据对应的未来背景数据,其中,过去背景数据和未来背景数据是不同类型的数据;使用循环模型,基于过去背景数据、提取的目标数据和未来背景数据,计算当前窗的识别结果。获取过去背景数据的步骤可包括:获取与序列数据中在当前窗之前的先前窗对应的状态参数作为过去背景数据;获取未来背景数据的步骤可包括:从序列数据提取在提取的目标数据之后的填充数据作为未来背景数据。获取所述状态参数的步骤可包括:响应于当前窗是序列数据的第一窗,将所述状态参数设置为默认值;响应于当前窗不是序列数据的第一窗,获取在对先前窗执行的识别期间获得的状态参数作为所述状态参数。在对先前窗执行的识别期间,可存储在对先前窗执行的识别期间获得的状态参数;获取在对先前窗执行的识别期间获得的状态参数的步骤可包括:检索存储的状态参数。先前窗和当前窗均可包括多个帧;获取所述状态参数的步骤可包括:获取与先前窗的最后帧对应的状态参数。在另一总体方面,一种训练方法包括:获取循环模型;从训练输入提取与当前窗对应的目标数据;在获取与训练输入中在当前窗之前的数据对应的过去背景数据;获取与训练输入中在当前窗之后的数据对应的未来背景数据,其中,过去背景数据和未来背景数据是不同类型的数据;训练循环模型,使得映射到训练输入的训练输出基于过去背景数据、提取的目标数据和未来背景数据被计算。获取过去背景数据的步骤可包括:获取与训练输入中在当前窗之前的先前窗对应的状态参数作为过去背景数据;获取未来语境数据的步骤可包括:从训练输入提取在提取的目标数据之后的填充数据作为未来背景数据。获取所述状态参数的步骤可包括:响应于当前窗是训练输入的第一窗,将所述状态参数设置为默认值;响应于当前窗不是训练输入的第一窗,获取在对先前窗执行的训练期间获得的状态参数作为所述状态参数。在对先前窗执行的训练期间,可存储在对先前窗执行的训练期间获得的状态参数;获取在对先前窗执行的训练期间获得的状态参数的步骤可包括:检索存储的状态参数。先前窗和当前窗均可包括多个帧;获取所述状态参数的步骤可包括:获取与先前窗的最后帧对应的状态参数。其他特征和方面从下面的具体实施方式、附图和权利要求将是清楚的。附图说明图1示出循环神经网络的示例。图2示出以窗长度展开的循环神经网络的示例。图3示出双向循环神经网络的示例。图4示出基于双向循环神经网络的语音识别的示例。图5示出基于状态参数和填充(padding)使用循环神经网络的序列数据识别的示例。图6示出将先前窗的状态参数应用于当前窗的示例。图7示出更新循环神经网络的每个节点的示例。图8示出识别设备的示例。图9示出训练设备的示例。图10示出识别方法的示例。图11示出训练方法的示例。图12本文档来自技高网...
用于使用循环模型执行识别和训练循环模型的方法和设备

【技术保护点】
1.一种识别方法,包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。

【技术特征摘要】
2016.12.14 KR 10-2016-01701981.一种识别方法,包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。2.如权利要求1所述的识别方法,还包括:暂时存储与当前窗的最后帧对应的状态参数,以用于后续窗。3.如权利要求1所述的识别方法,还包括:排除与填充相关联的状态参数和基于循环模型计算的填充数据的输出数据。4.如权利要求1所述的识别方法,其中,计算识别结果的步骤包括:以当前窗的窗长度和填充长度展开循环模型;针对每个帧将状态参数、提取的目标数据和提取的填充数据输入到展开的循环模型,并计算与包括在当前窗中的帧对应的输出数据。5.如权利要求1所述的识别方法,其中,计算识别结果的步骤包括:基于与先前窗的最后帧对应的状态参数,更新与当前窗的第一帧对应的节点的输入值。6.如权利要求1所述的识别方法,其中,提取目标数据和填充数据的步骤包括:从先前窗的最后帧数据之后的帧数据开始从序列数据提取与窗长度对应的数据作为与当前窗对应的目标数据。7.如权利要求1所述的识别方法,其中,提取目标数据和填充数据的步骤包括:从当前窗的最后帧数据之后的帧数据开始从序列数据提取与填充长度对应的数据作为与填充对应的填充数据。8.如权利要求1所述的识别方法,其中,循环模型是被训练为响应于基于训练数据的训练输入输出训练输出的双向循环神经网络。9.如权利要求1所述的识别方法,其中,循环模型包括:与包括在窗和填充中的每个帧对应的节点;计算识别结果的步骤包括:基于所述节点的前向通路,顺序地从窗的第一帧到窗的最后帧更新状态参数;基于所述节点的反向通路,顺序地从窗的最后帧到窗的第一帧更新状态参数;将基于前向通路的状态参数和基于反向通路的状态参数提供给后续层的节点。10.如权利要求1所述的识别方法,其中,序列数据对应于语音信号;计算识别结果的步骤包括:从与当前窗对应的目标数据辨识发音。11.如权利要求1所述的识别方法,其中,获取与先前窗对应的状态参数的步骤包括:响应于当前窗是相对于序列数据的第一窗,将与先前窗对应的状态参数确定为默认值。12.如权利要求1所述的识别方法,其中,提取目标数据和填充数据的步骤包括:响应于当前窗是相对于序列数据的最后窗,排除填充数据。13.一种存储指令的非暂时性计算机可读介质,当所述指令由处理器执行时,使所述处理器执行如权利要求1所述的识别方法。14.一种识别设备,包括:存储器,被配置为存储循环模型;处理器,被配置为:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。15.一种训练方法,包括:获取循环模型;从训练输入提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;训练循环模型,使得映射到训练输入的训练输出基于状态参数、提取的目标数据和提取的填充数据被计算。16.如权利要求15所述的训练方法,还包括:响应于训练输入中存在与后续窗对应的数据,暂时存储与当前窗的最后帧对应的状态参数,以...

【专利技术属性】
技术研发人员:柳尚贤
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1