一种基于全局索引表的快速特征采集方法技术

技术编号:36694948 阅读:43 留言:0更新日期:2023-02-27 20:05
本发明专利技术公开了一种基于全局索引表的快速特征采集方法,该方法包括如下步骤:剖析内存使用,确定可用于缓存分配的最大GPU内存量;在离线状态下,按出度数对顶点进行预排序。并在运行时选择高出度的顶点来填充GPU缓存;确定mini

【技术实现步骤摘要】
一种基于全局索引表的快速特征采集方法


[0001]本专利技术属于机器学习中神经网络算法应用领域,尤其涉及一种基于全局索引表的快速特征采集方法。

技术介绍

[0002]图神经网络(GNN)是针对图这一数据结构的深度学习模型,它在多项基于图的机器学习任务中表现出色,并且具有较高的可解释性,近年来已成为一种广泛应用的图表示学习方法。GNN在广义上是指以图结构为输入的所有神经网络,其核心思想是学习一种映射,将图结构中的节点及其邻居节点的特征映射为该节点的低维隐特征表示。为了在GPU内存容量有限的场景下实现大规模图神经网络训练,基于采样的图神经网络训练被提出。图神经网络采样流程中的每一次迭代过程主要分为三个阶段,即采样、数据加载和GPU计算。
[0003]快速特征采集是指将缓存在GPU显存上的节点特征数据进行快速查找的过程(节点特征数据是图结构中的节点所对应的特征数据,图结构中每个节点都有其对应的特征数据),通过快速查找训练所需的节点特征数据来提高性能。图神经网络采样流程中的快速特征采集是数据加载过程能否快速进行的关键。/>[0004]目前本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于全局索引表的快速特征采集方法,其特征在于,所述的基于全局索引表的快速特征采集方法包括如下步骤:步骤一、剖析内存使用,确定可用于缓存分配的最大GPU内存量;步骤二、在离线状态下,按出度数对顶点进行预排序。并在运行时选择高出度的顶点来填充GPU缓存;步骤三、确定mini

batch输入的顶点数;步骤四、确定全局索引表中局部顶点的位置;步骤五、从GPU缓存数据中获取输入特征;步骤六、当前批次特征采集结束;如权利要求1所述的基于全局索引表的快速特征采集方法,其特征在于,所述的步骤一通过剖析第一个mini

batch训练之后,在训练期间检查空闲GPU内存的大小,来确定可用于缓存分配的最大GPU内存量;如权利要求1所述的基于全局索引表的快速特征采集方法,其特征在于,步骤二所述的在离线状态下,按出度数对顶点进行预排序。并在运行时选择高出度的顶点来填充GPU缓存:步骤一、依据neighbor sampling算法的独特访问模式,顶点的出度程度表示了它在整个epoch中被选择的概率,且顶点的出度越高,它就越有可能成为其他顶点...

【专利技术属性】
技术研发人员:王耀彬申超唐苹苹刘欢杨梁从明陈俊仕安虹
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1