基于强化学习的图匹配方法、装置、介质和电子设备制造方法及图纸

技术编号:40788768 阅读:29 留言:0更新日期:2024-03-28 19:19
本发明专利技术涉及一种基于强化学习的图匹配方法、装置、介质和电子设备。用于计算机技术领域,其中基于强化学习的图匹配方法,包括:获取成对图的信息;根据成对图的信息构造关联图,关联图包括成对图的信息;获取动作集合;根据关联图和动作集合生成关联图子图;根据关联图子图生成环境状态特征;根据环境状态特征生成动作期望奖赏值;根据动作期望奖赏值选择关联图动作;根据关联图动作生成分配矩阵。基于构建的关联图定义了直观合理的马尔可夫决策过程,引入了图卷积神经网络作为状态表示网络,并使用D3QN作为估值网络,最终在保证关联结果准确性的同时,避开了训练数据几乎无法标注的难题。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种基于强化学习的图匹配方法、装置、介质和电子设备


技术介绍

1、图匹配旨在通过同时考虑节点和边的相似性,找到图中节点的对应关系。其作为计算机视觉和模式识别领域的一个重要课题,近年来受到了广泛关注。随着深度学习的兴起,许多基于深度学习的图匹配算法相继涌现,并在图像配准、目标跟踪等任务中取得了优异的效果。然而,图匹配问题本身属于np完全的组合优化问题,其复杂性导致获取深度学习所需的含标注训练样本数据异常困难。传统的监督学习方法需要大量标注好的数据进行训练,但对于图匹配问题,由于匹配对应关系是未知的,很难获得大规模的准确标注数据。这一困难成为限制深度学习在图匹配上应用的主要瓶颈。

2、强化学习是一种机器学习方法,它关注智能体在环境中采取行动并获得反馈奖励的过程。强化学习的目标是使智能体学会选择在不同状态下的最优行动,从而最大化累积的长期奖励。在强化学习中,智能体通过与环境的交互来不断学习,并根据环境给出的奖励信号调整自己的策略。这使得强化学习在处理复杂任务和缺乏标签数据的情况下具有一定的优势,为图匹配问题的求解提供了本文档来自技高网...

【技术保护点】

1.一种基于强化学习的图匹配方法,其特征在于,包括:

2.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述成对图的信息包括:所述成对图之一G1的顶点集合V1和所述成对图之二G2的顶点集合V2,所述根据所述成对图的信息构造关联图的步骤包括:

3.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述获取动作集合的步骤包括:

4.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述根据所述关联图和所述动作集合生成关联图子图的步骤包括:

5.根据权利要求4所述基于强化学习的图匹配方法,其特征在于,所述根据所述关联图子图生...

【技术特征摘要】

1.一种基于强化学习的图匹配方法,其特征在于,包括:

2.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述成对图的信息包括:所述成对图之一g1的顶点集合v1和所述成对图之二g2的顶点集合v2,所述根据所述成对图的信息构造关联图的步骤包括:

3.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述获取动作集合的步骤包括:

4.根据权利要求1所述基于强化学习的图匹配方法,其特征在于,所述根据所述关联图和所述动作集合生成关联图子图的步骤包括:

5.根据权利要求4所述基于强化学习的图匹配方法,其特征在于,所述根据所述关联图子图生成环境状态特征的步骤包括:

6.根据权利要求5所述基于强化学习的图匹配方法,其特征在于,所述根据所述...

【专利技术属性】
技术研发人员:杨旭陆昱辰张相凯孙立国吕品
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1