使用基于图的时间分类训练神经网络制造技术

技术编号：38403276 阅读：11 留言：0更新日期：2023-08-07 11:13

提供了一种用于使用由代表标签和标签之间的转移的边连接的节点的有向图，用基于图的时间分类(GTC)目标函数来训练神经网络的方法。有向图指定了标签序列和概率分布序列之间的非单调对齐以及对标签重复的约束中的一种或组合。该方法包括：实施神经网络，以将观察序列变换为概率分布序列；以及基于GTC目标函数更新神经网络的参数，GTC目标函数被配置为使通过将有向图展开到观察序列的长度并将每个展开的节点和边的序列映射到可能的标签序列而生成的所有可能的标签序列的条件概率之和最大化。最大化。最大化。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用基于图的时间分类训练神经网络

[0001]本专利技术总体上涉及训练神经网络，并且更具体地，涉及使用基于图的时间分类(GTC)目标来训练神经网络的方法。

技术介绍

[0002]神经网络可以再现和建模非线性过程，因此在过去几十年中，神经网络已被用于各种学科的众多应用中。神经网络可以通过处理示例来学习(或被训练)，每个示例含有已知的“输入”和“结果”，在已知的“输入”和“结果”两者之间形成概率加权关联，这些存储在网(net)本身的数据结构中。来自给定示例的神经网络的训练通常通过确定网络的处理输出(通常是预测)和在本文中也被称为训练标签的目标输出之间的差异来进行。这种差异代表了训练旨在减少的错误。因此，网络然后根据学习规则并使用此错误值调整其加权关联。逐次调整将使神经网络产生与目标输出越来越相似的输出。经过足够数量的这些调整后，可以基于一定标准终止训练。
[0003]这种类型的训练通常被称为监督学习。在监督学习期间，神经网络通过考虑示例来“学习”执行任务，通常无需用特定于任务的规则来编程。例如，在图像识别中，它们可能通过分析已经被标注为“猫”或“不是猫”的示例图像并使用结果来识别其它图像中的猫来学习识别含有猫的图像。它们在没有猫的任何先验知识(例如，它们有毛皮、尾巴、胡须和类似猫的脸)的情况下做这些。相反，它们从它们处理的示例自动生成识别特征。

技术实现思路

[0004]技术问题
[0005]然而，要执行此类监督学习，需要将图像标注为猫或狗。这种标注是乏味和费力的过程。此外，在此图像识别示...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法，该方法用于使用来自由代表标签和标签之间的转移的边连接的节点的有向图的监督信息，用基于图的时间分类(GTC)目标函数训练神经网络，其中，所述有向图代表由神经网络输出的概率分布序列和标签的可能的对齐路径，其中，所述有向图的结构指定了标签序列和所述概率分布序列之间的非单调对齐以及所述标签序列中对标签重复的约束中的一种或组合，其中所述神经网络的输入是观察序列，并且所述神经网络的输出是在标签的集合中的所有标签上的所述概率分布序列，该方法包括以下步骤：实施所述神经网络，以将所述观察序列变换为所述概率分布序列；以及基于所述GTC目标函数更新所述神经网络的参数，所述GTC目标函数被配置为使通过将所述有向图展开到所述概率分布序列的长度并将每个展开的节点和边的序列映射到标签序列而生成的所有可能的标签序列的条件概率之和最大化，其中所有标签序列的条件概率之和是根据由所述神经网络确定的所述概率分布序列而估计的。2.根据权利要求1所述的方法，其中，所述有向图代表所述概率分布序列和所述标签序列的多个可能的对齐路径，使得可能通过所述有向图的结构允许多个唯一标签序列，其是在坍缩标签重复并且从所述多个唯一标签序列去除空白标签之后获得的，从而得到所述标签序列与所述概率分布序列之间的所述非单调对齐。3.根据权利要求2所述的方法，其中，通过允许从一个标签到多个其它非空白标签的转移、通过允许从一个标签到多个其它空白标签的转移、或两者，将所述非单调对齐编码在所述有向图的结构中。4.根据权利要求1所述的方法，其中，所述有向图的结构通过使到代表标签的节点的自转移被代表相同标签的已连接节点序列代替，来指定对标签重复的约束。5.根据权利要求1所述的方法，其中，所述有向图的展开包括根据所述有向图的结构生成不同的标签序列和对齐路径，使得每个所生成的标签序列的长度与所述概率分布序列的长度相匹配。6.根据权利要求1所述的方法，其中，用所述GTC目标函数的训练定义了基于所述条件概率的损失函数，并且其中，用所述GTC目标函数的训练使用梯度下降训练来更新所述神经网络的参数，以减小所述GTC损失。7.根据权利要求6所述的方法，其中，所述GTC目标函数通过定义了所述有向图中的所有有效标签对齐路径和所有有效时间对齐路径的展开的有向图，对所有可能的节点和边的序列进行边缘化，以参照这种监督信息来优化所述神经网络输出。8.根据权利要求1所述的方法，其中，所述有向图是具有与不同权重相关联的至少一些边的加权图，并且其中，所述训练使用所述有向图中相应边的权重和由所述神经网络估计出的所述概率分布，来计算所述节点序列的条件概率。9.根据权利要求8所述的方法，其中，所述有向图是具有与节点的转录输出在时间实例是真实转录输出的概率相对应的数值相关联的连接节点的边的加权有向图，其中，所述GTC目标函数被配置为学习时间对齐和标签对齐，以获得所述加权有向图所允许的最优标签序列，并且其中，所述使用GTC目标函数训练所述神经网络更新所述神经网络，以关于图格式的监
督信息和相关联的训练样本减小损失。10.根据权利要求9所述的方法，其中，对于梯度下降训练，所述GTC目标函数是关于所述神经网络的输出的微分。11.根据权利要求1所述的方法，该方法还包括以下步骤：接收多个标签序列；基于所述多个标签序列构建混淆网络，其中，所述混淆网络包括经由多条弧彼此连接的多个节点，并且其中，所述多条弧中的每条弧对应于具有标签的弧或没有标签的弧；优化所构建的混淆网络，以产生优化后的混淆网络；以及从所述优化后的混淆网络生成所述有向图。12.根据权利要求11所述的方法，其中，为了构建所述混淆网络，该方法还包括以下步骤：使用动态规划方法将所述多个标签序列彼此对齐，并且其中，所述动态规划方法使所述多个标签序列之间的编辑距离最小化。13.根据权利要求11所述的方法，其中...

【专利技术属性】
技术研发人员：N，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人