The invention provides a method of data transmission delay of the flow structure of an optimized data and a system thereof, wherein the method comprises the following steps: S1: historical behavior records for each instruction slots corresponding to the downstream and upstream node, and according to the historical behavior of the downstream node can predict the upstream to the node in advance of the launch of free information; S2: if the downstream node can upstream to the node in advance of the launch of free information, the data stored in the node instruction slots to predict emission components; the data contained in the instruction slots hop delay field, is used to represent the original operating number of the target operating upstream node and downstream node at the most soon the number of hops required X; S3: according to the number of hops delay field, the downstream node after X cycles to send upstream storage nodes in the pre launch part in the Command slot data.
【技术实现步骤摘要】
一种优化数据流架构数据传输延迟的方法及其系统
本专利技术涉及数据传输
,特别涉及一种降低数据传输延迟的方法及其系统。
技术介绍
随着计算机体系结构的发展,领域专用的计算机体系结构成为主要发展趋势。在面向特定应用时,专用型结构利用应用特征对结构进行相应的优化,从而更好地发挥出硬件的计算性能。在高性能计算领域,数据流计算是领域专用计算结构的一个重要分支,数据流计算表现出了较好的性能和适用性。数据流指令执行的基本原则是:所有的源操作数都准备好了,并且下游节点有空闲的数据槽可以接收数据,则该指令即可发射到执行单元当中运算执行。在数据流计算模式中,源指令(生产者,上游节点)执行的结果不会写入共享寄存器或共享缓存,而是直接传递给目的指令(消费者,下游节点)。在传统数据流架构当中,指令之间的数据传递方式如图1所示。在这个例子当中,上游节点PE3106当中的指令槽109的目的操作数字段111要传递给下游节点PE9101的指令槽102的源操作数字段110,并且假定上游节点PE3106的指令槽109当中的源操作数都已经“Ready”。需要经历的正常步骤如下:步骤101:下游节点PE9101的指令槽102被选择进入到发射队列Fire104当中,然后接着就可以进入执行单元执行;步骤102:下游节点PE9101的指令槽102的源操作数字段110依赖于上游节点106的指令槽109的目标操作数字段111,指令槽102发射之后,通过网络105通知上游节点106的指令槽109的目标操作数字段111,下游已经“Ready”,可以接收上游节点发送的源操作数数据;步骤103:上游节点PE3 ...
【技术保护点】
一种优化数据流架构数据传输延迟的方法,其特征在于,包括以下步骤:S1:记录上游节点和下游中每个指令槽对应的历史行为,并根据所述历史行为预测所述下游节点是否可以向所述上游节点提前发射空闲状态信息;S2:若所述下游节点可以向所述上游节点提前发射空闲状态信息,则将节点中的指令槽数据存储到预判发射部件中;所述指令槽数据中包含跳数延迟字段,用于表示上游节点的目标操作数到达下游节点的原操作数最快所需的跳数X;S3:根据所述跳数延迟字段,下游节点在X个周期之后向上游节点发送存储在所述预判发射部件中的指令槽数据。
【技术特征摘要】
1.一种优化数据流架构数据传输延迟的方法,其特征在于,包括以下步骤:S1:记录上游节点和下游中每个指令槽对应的历史行为,并根据所述历史行为预测所述下游节点是否可以向所述上游节点提前发射空闲状态信息;S2:若所述下游节点可以向所述上游节点提前发射空闲状态信息,则将节点中的指令槽数据存储到预判发射部件中;所述指令槽数据中包含跳数延迟字段,用于表示上游节点的目标操作数到达下游节点的原操作数最快所需的跳数X;S3:根据所述跳数延迟字段,下游节点在X个周期之后向上游节点发送存储在所述预判发射部件中的指令槽数据。2.根据权利要求1所述的优化数据流架构数据传输延迟的方法,其特征在于,所述预判发射部件的内部设置存储深度N,采用先进先出结构存取数据。3.根据权利要求1或2所述的优化数据流架构数据传输延迟的方法,其特征在于,所述跳数延迟字段是通过节点的坐标静态计算而产生的。4.一种优化数据流架构数据传输延迟的系统,其特征在于,包括:预测位,分布在节点...
【专利技术属性】
技术研发人员:冯煜晶,谭旭,张浩,王达,孙凝辉,
申请(专利权)人:北京中科睿芯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。