基于博弈论框架构建的神经网络模型终身学习方法技术

技术编号：28225507 阅读：16 留言：0更新日期：2021-04-28 09:58

本申请提出一种基于博弈论框架构建的神经网络模型终身学习方法，包括：通过对环境熵与网络熵的定量表达，得到网络驱动因子，促使网络结构的变化，实现网络的持续学习，在环境发生空间以及时间上的变化时，保持有效，可迁移以及持续演化。同时将网络的成本，精度以及输出作为反馈信息，进一步帮助网络调整结构，实现数据闭环，实现网络随着时间演化的可持续学习，从而实现稳定有效的自学习。由此，本申请可以在数据集发生模态与时间变化的情况下持续学习，具有较强的实际应用前景。具有较强的实际应用前景。具有较强的实际应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
基于博弈论框架构建的神经网络模型终身学习方法

[0001]本申请涉及计算机
，尤其涉及一种基于博弈论框架构建的神经网络模型终身学习方法。

技术介绍

[0002]随着信息技术的发展，目前人工神经网络面临的问题除了特定领域的数据集不足，还有一些领域存在具有多模态并且随时间快速变化的数据集。对于特定的数据集的训练，一个成熟的网络表现出对于数据集变化的滞后性：在训练集上表现良好的模型会固定参数，对于其他模态以及随时间迁移的数据不再适用。并且当前的网络对噪音鲁棒性差，对于新的场景以及一些特殊场景下可迁移性差，对于新的数据集无法做到适应。

技术实现思路

[0003]本申请的目的旨在至少在一定程度上解决上述的技术问题之一。
[0004]为此，本申请的一个目的在于提出一种基于博弈论框架构建的神经网络模型终身学习方法。本申请通过在博弈论的框架下，以熵平衡的实现过程作为驱动因子，通过熵平衡驱动下网络节点消长策略的建模与到网络达博弈平衡的过程分析，建立博弈论框架下的终身学习，从而实现网络随着时间演化的可持续学习，从而实现稳定有效的自学习。
[0005]为达上述目的，本申请一方面实施例提出了一种基于博弈论框架构建的神经网络模型终身学习方法，包括：
[0006]对输入图像进行特征提取，获得针对所述输入图像的特征向量；
[0007]将所述输入图像的特征向量输入至环境熵计算网络进行环境熵计算，获得所述环境熵计算网络输出的环境熵；
[0008]基于网络熵计算网络对主体网络计算网络熵，并将...

【技术保护点】

【技术特征摘要】
1.一种基于博弈论框架构建的神经网络模型终身学习方法，其特征在于，包括：对输入图像进行特征提取，获得针对所述输入图像的特征向量；将所述输入图像的特征向量输入至环境熵计算网络进行环境熵计算，获得所述环境熵计算网络输出的环境熵；基于网络熵计算网络对主体网络计算网络熵，并将所述网络熵映射到与所述环境熵相同的空间；根据所述环境熵和所述网络熵生成对应的熵平衡驱动因子；根据所述熵平衡驱动因子驱动所述主体网络中连接节点的策略与权重的变化，并根据变化后的所述主体网络获取网络成本和网络误差；将所述网络成本、所述网络误差和所述主体网络的输出结果作为反馈信息，并将所述反馈信息和所述输入图像的特征向量输入至所述环境熵计算网络进行环境熵计算，返回执行所述获得所述环境熵计算网络输出的环境熵的步骤。2.根据权利要求1所述的方法，其特征在于，所述环境熵计算网络的学习过程如下：2.根据权利要求1所述的方法，其特征在于，所述环境熵计算网络的学习过程如下：其中，f
e
(),f
d
()分别是编码器与解码器，是所述编码器的权重，b
e
是所述编码器的偏置，是所述解码器的权重，b
d
是所述解码器的偏置，z
u
是包含有熵信息的隐变量，y
u
是通过含熵隐变量z
u
解码出的特征；所述编码器通过对特征向量的学习，将其映射到包含有熵信息的隐空间中；所述解码器将从所述隐空间中采样的隐变量解码为特征，验证所述隐变量的可靠性；其中，在训练时，需要满足以下目标函数：minL
u
＝||x
u
‑
y
u
||2；其中，x
u
为所述输入图像的特征向量；将训练好的编码器作为所述环境熵计算网络。3.根据权利要求1所述的方法，其特征在于，所述网络熵计算网络的学习过程如下：征在于，所述网络熵计算网络的学习过程如下：其中，g
e
(),g
d
()分别是编码器和解码器，是所述编码器的权重，α
e
是所述编码器的偏置，是所述解码器的权重，α
d
是所述解码器的偏置；z
n
是包含有熵信息的隐变量，y
n
是通过含熵隐变量z
n
重建的网络熵；在训练时，需要满足以下的目标函数：minL
n
＝||H
graph
‑
y
n
||2其中，H
graph
为图形熵，其中，为所述主体网络之中每个节点i与d
i
个节点相连的连接强...

【专利技术属性】
技术研发人员：郭雨晨，邓岳，李博翰，戴琼海，丁贵广，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人