当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于信息图压缩的技术制造技术

技术编号:22296595 阅读:12 留言:0更新日期:2019-10-15 05:34
本公开涉及用于信息图压缩的技术。描述了用于为图信息提供图压缩结构的技术和设备。在一个实施例中,例如,设备可以包括至少一个存储器,至少一个处理电路,以及逻辑,该逻辑耦合到该至少一个处理电路,所述逻辑用于:访问包括多个节点的图信息,为多个节点中的每个节点定义唯一索引,确定多个节点中的每个节点是否具有至少一个邻居节点,并且生成图压缩结构,该图压缩结构包括用于多个节点中具有至少一个邻居节点的每个节点的条目以及包括每个条目的邻居节点阵列的邻接列表。

Technology for Information Graph Compression

【技术实现步骤摘要】
用于信息图压缩的技术
本文的实施例总体上涉及信息处理,并且更具体地,涉及处理图数据结构的信息。背景诸如人工智能(AI)应用之类的各种过程使用诸如图、树和链表之类的复杂数据结构来操作。例如,许多AI应用利用多个大图来存储和处理信息。传统的图存储和访问技术由于存储器访问开销而经历严重的性能降级。例如,复杂数据结构可以分布在处理器级高速缓存存储器之中。从这样的复杂数据结构访问元素或节点可能涉及执行多个指针解引用,通常称为“指针追踪”。更具体地,在图中从节点行进到其邻居,需要存储器中的指针的随机“追踪”,这会显著降低性能。附图说明图1示出了第一操作环境的实施例。图2示出了图数据结构的实施例。图3示出了压缩信息结构的实施例。图4示出了使用压缩信息结构访问数据的伪代码的实施例。图5示出第一逻辑流程的实施例。图6示出第二逻辑流程的实施例。图7示出了实验数据。图8示出了存储介质的示例。图9示出了计算架构的实施例。具体实施方式各种实施例通常可以涉及用于复杂数据结构的管理信息。在一些实施例中,复杂数据结构可以包括信息图。在各种实施例中,图压缩过程可以操作以生成表示信息图中的信息的压缩信息结构(诸如图节点、节点邻居等)。在一些实施例中,压缩信息结构可以包括用于每个图节点的邻接列表,每个图节点具有至少一个邻居,该邻接列表包括该图节点的邻居节点的列表。在各种实施例中,可以使用标记协议来标记信息图。在这样的实施例中,可以仅将标记的(或可标记的)节点包括在邻接列表中作为邻居节点。指针追踪导致遍历复杂数据结构(诸如大图)的算法的显著性能降级。在图中从节点行进到其邻居,需要存储器中的指针的随机“追踪”,这会显著降低性能。在图(如知识库(KB)或知识图)上进行推理的说明性协议是标记传递(MP)协议,例如,如Hendler,J.A.在“IntegratingMarker-PassingandProblemSolving:SpreadingActivationApproachtoImprovedChoiceinPlanning(整合标记传递与解决问题:传播激活方法改进规划选择)”中所述以及LawrenceErlbaumAssociates,N.J.于1987年在其变体中所述。MP协议主要在图(诸如KB图)上执行双向搜索。执行时间的大部分都花在上下扫描图上。在搜索期间,MP算法随机访问各个节点。因此,MP协议的主要处理是在分析期间(诸如在执行搜索时)追踪节点。用于解决图数据结构中的指针追踪的常规技术包括跨多个机器分布图以消除单个机器中存在大图(例如,SparkGraphX和GraphLab)。其他传统技术涉及使用专用硬件加速(诸如经由使用智能高速缓存的加速器和用于并行的多线程)。在机器集群上分发图的至少一个缺点是分布式系统所需的通信和同步开销。此外,这些技术不适用于仅使用单个设备操作的客户端和边缘系统。在机器集群上分布图的另一个缺点是它需要可以仅用于这些算法的专用资源(诸如硬件和/或软件资源)。基于并行性和智能高速缓存的传统技术引入了同步的开销并且仍然具有指针追踪。虽然这些技术可以实现稍微更低的高速缓存丢失率,但是它们不能提供使专用软件和/或硬件正当的性能提升。信息的压缩表示与根据传统技术(例如,CSC和CSR)的用于稀疏矩阵的压缩表示不同。在稀疏矩阵的CSC/CSR中,每个节点都具有所有邻居的列表,以行(CSR)或列(CSC)来表示。根据一些实施例的过程仅保存节点v的协议相关的邻居。例如,在一些实施例中,标记(例如,PM协议的标记)可以传递给它们(但不是所有邻居)的节点v的邻居可以被保存。对于每个节点,可以在预处理阶段期间计算协议相关的邻居。因此,一些实施例可以提供图压缩过程,该图压缩过程可操作用于提供复杂数据结构信息的压缩和/或预处理。例如,在预处理期间,每个节点的协议相关的邻居(例如,MP协议)可以被确定并且可以被存储在压缩信息结构中。因此,协议(例如,MP协议)可以与图的有效(例如,压缩)版本一起操作,使得相比于比传统技术,从节点到其邻居的传播更快并且需要更少的资源(例如,处理和/或存储器资源)。例如,使用根据一些实施例的技术,在没有添加硬件的情况下,针对MP协议(例如,在英特尔架构(IA)上)实现了改进的性能(诸如五十倍的性能改进)。另外,根据一些实施例,可以压缩图、数据结构等,并且包括与传统压缩方法的存储空间要求相比,需要较少的存储空间。例如,3600个元素的图信息可能需要542KB的存储器空间。诸如稀疏矩阵之类的传统技术可能需要260KB的存储器空间。然而,根据一些实施例的图压缩结构可能仅需要100KB。在另一个示例中,具有1000万范围内的元素的图信息可能需要1.5GB的存储器空间。稀疏矩阵可能需要20GB的存储器空间。然而,根据一些实施例的图压缩结构可能仅需要0.2GB。此外,传统的图信息压缩技术不涉及指针追踪。因此,根据一些实施例的图压缩过程提供了优于传统图信息压缩技术的非限制性技术优势,因为根据一些实施例的图压缩过程减少或完全消除了指针追踪。以这种方式,根据一些实施例的图压缩过程可以允许图信息的更有效地处理和存储,包括与人工智能(AI)过程相关联的非常大的图。在本说明书中,可以阐述诸如组件和系统配置之类的许多具体细节,以便提供对本专利技术更加透彻的理解。然而,本领域技术人员将理解的是,可以在没有这些具体细节的情况下实践本专利技术。另外,并未详细地示出公知的结构、电路和其他特征,以避免不必要地模糊本专利技术。在以下描述中,对“一个实施例(oneembodiment)”、“实施例(anembodiment)”、“示例实施例(exampleembodiment)”、“各种实施例(variousembodiments)”等的引用表明如此描述的(多个)实施例可以包括特定的特征、结构或特性,但不止一个实施例可以并且不是每一个实施例必定包括这些特定的特征、结构或特性。此外,一些实施例可具有针对其它实施例描述的特征中的一些、全部或者不具有这些特征。如在本说明书和权利要求书中所使用的,除非另有说明,使用序数形容词“第一(first)”、“第二(second)”、“第三(third)”等来描述要素,仅仅指示要素的特定实例或相同要素的不同实例的特定实例被提及,并且不旨在暗示如此描述的要素必须在或者时间上、空间上、排名上、或以任何其他方式处于特定序列中。图1示出了可以表示各种实施例的操作环境100的示例。图1中描绘的操作环境100可以包括具有处理电路110、图处理逻辑120、存储器单元130和收发机150的设备105。设备105可以是或可以包括诸如膝上型计算机、个人计算机(PC)、工作站计算机、平板电脑、个人数字助理(PDA)、智能手机、平板手机、图像捕获设备、服务器、网络设备等之类的计算机设备。处理电路110可以通信地耦合到图处理逻辑120、存储器单元130和/或收发机150。在各种实施例中,处理电路110可以包括中央处理单元(CPU)和/或可以在片上系统(SoC)上实现或者作为片上系统(SoC)。根据一些实施例,处理电路110可以包括和/或可以访问用于执行过程的各种逻辑。例如,处理电路110可以包括和/或可以访问图处理逻辑120、本文档来自技高网...

【技术保护点】
1.一种设备,包括:至少一个存储器;至少一个处理电路,以及逻辑,所述逻辑耦合到所述至少一个处理电路,所述逻辑用于:访问包括多个节点的图信息,为所述多个节点中的每个节点定义唯一索引,确定所述多个节点中的每个节点是否具有至少一个邻居节点,并且生成图压缩结构,所述图压缩结构包括用于所述多个节点中具有至少一个邻居节点的每个节点的条目和包括每个条目的邻居节点阵列的邻接列表。

【技术特征摘要】
2018.03.30 US 15/941,1681.一种设备,包括:至少一个存储器;至少一个处理电路,以及逻辑,所述逻辑耦合到所述至少一个处理电路,所述逻辑用于:访问包括多个节点的图信息,为所述多个节点中的每个节点定义唯一索引,确定所述多个节点中的每个节点是否具有至少一个邻居节点,并且生成图压缩结构,所述图压缩结构包括用于所述多个节点中具有至少一个邻居节点的每个节点的条目和包括每个条目的邻居节点阵列的邻接列表。2.如权利要求1所述的设备,其特征在于,所述图信息包括语义网络。3.如权利要求1所述的设备,其特征在于,所述图信息包括语义网络的知识库(KB)图。4.如权利要求1所述的设备,其特征在于,所述至少一个邻居节点包括标记传递(MP)协议的至少一个可标记邻居。5.如权利要求1所述的设备,其特征在于,所述条目包括图中具有至少一个邻居节点的节点,所述节点可以向所述至少一个邻居节点发送标记传递(MP)协议的标记。6.如权利要求1-5中任一项所述的设备,所述逻辑用于在没有指针追踪的情况下执行所述图压缩结构的分析。7.如权利要求1-5中任一项所述的设备,所述逻辑用于经由所述邻接列表来访问所述条目的每个邻居节点。8.如权利要求1-5中任一项所述的设备,所述逻辑用于使用标记传递(MP)协议来分析所述图压缩结构。9.如权利要求1-5中任一项所述的设备,所述逻辑用于通过将所述多个节点中的每个节点映射到所述唯一索引来生成所述图压缩结构。10.如权利要求1-5中任一项所述的设备,所述逻辑用于通过为所述多个节点中具有可标记邻居的每个节点生成所述邻接列表来生成所述图压缩结构。11.如权利要求1-5中任一项所述的设备,所述逻辑用于通过以下步骤来生成所述图压缩结构:将所述多个节点中的每个节点映射到所述唯一索引并且为所述多个节点中具有可标记邻居的每个节点生成所述邻接列表。12.如权利要求1至5中任一项所述的设备,其中所述图信息包括N个节点,所述逻辑用于通过以下步骤来生成所述图压缩结构:将所述N个节点中的每个节点映射到所述唯一索引以形成组Ni={0,…,N-1}并且根据标记传递(MP)协议、为Ni中具有可标记邻居的...

【专利技术属性】
技术研发人员:E·科恩A·阿巴里亚
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1