The invention provides a remote direct memory access system based on Park Shuffle. The system comprises a sender and a receiver; the sender includes a sender, a transmission channel and a transmission manager; the sender stores the acquired transmission data into the transmission channel and invokes the transmission manager; after the transmission manager is invoked, the check information is generated from the transmission data and stored in the transmission channel. The receiver includes a receiver, a receiving channel and a receiving manager; the receiver obtains the transmission data and checking information in the transmitting channel through remote direct memory access technology, stores the transmission data and the checking information into the receiving channel, and calls the receiving manager; after the receiving manager is invoked, the checking information is checked according to the checking information. The transmission data are verified.
【技术实现步骤摘要】
基于SparkShuffle的远程直接内存访问系统
本专利技术涉及远程内存直接访问
,尤指一种基于SparkShuffle的远程直接内存访问系统。
技术介绍
在MapReduce框架中,Shuffle是连接Map和Reduce之间的桥梁,Reduce要读取到Map的输出必须要经过Shuffle这个环节;而Reduce和Map过程通常不在一台节点,这意味着Shuffle阶段通常需要跨网络以及一些磁盘的读写操作,因此Shuffle的性能高低直接影响了整个程序的性能和吞吐量。与MapReduce计算框架一样,Spark作业也有Shuffle阶段,通常以Shuffle来划分Stage;而Stage之间的数据交互是需要Shuffle来完成的。整个过程如图1所示。不管是MapReduce还是Spark作业,Shuffle操作是很消耗CPU、RAM、磁盘还有网络资源的;需要尽可能地避免Shuffle操作。
技术实现思路
为了解决目前Spark的Shuffle阶段消耗过大、数据通量低等问题,本专利技术实施例的主要目的在于提供一种一种基于SparkShuffle的远程直接内存访问系统,所述系统包括:发送端及接收端;所述发送端包括发送器、发送通道及发送管理器;所述发送器将获取到的传输数据存储至所述发送通道,并调用所述发送管理器;所述发送管理器被调用后,根据所述传输数据生成核对信息,并将所述核对信息存储至所述发送通道;所述接收端包括接收器、接收通道及接收管理器;所述接收器通过远程直接内存访问技术获取所述发送通道中的传输数据及核对信息,将所述传输数据及所述核对信息存储至所述接收 ...
【技术保护点】
1.一种基于Spark Shuffle的远程直接内存访问系统,其特征在于,所述系统包括:发送端及接收端;所述发送端包括发送器、发送通道及发送管理器;所述发送器将获取到的传输数据存储至所述发送通道,并调用所述发送管理器;所述发送管理器被调用后,根据所述传输数据生成核对信息,并将所述核对信息存储至所述发送通道;所述接收端包括接收器、接收通道及接收管理器;所述接收器通过远程直接内存访问技术获取所述发送通道中的传输数据及核对信息,将所述传输数据及所述核对信息存储至所述接收通道,并调用所述接收管理器;所述接收管理器被调用后,根据所述核对信息对所述传输数据进行核验。
【技术特征摘要】
1.一种基于SparkShuffle的远程直接内存访问系统,其特征在于,所述系统包括:发送端及接收端;所述发送端包括发送器、发送通道及发送管理器;所述发送器将获取到的传输数据存储至所述发送通道,并调用所述发送管理器;所述发送管理器被调用后,根据所述传输数据生成核对信息,并将所述核对信息存储至所述发送通道;所述接收端包括接收器、接收通道及接收管理器;所述接收器通过远程直接内存访问技术获取所述发送通道中的传输数据及核对信息,将所述传输数据及所述核对信息存储至所述接收通道,并调用所述接收管理器;所述接收管理器被调用后,根据所述核对信息对所述传输数据进行核验。2.根据权利要求1所述的系统,其特征在于,所述发送端还包括注册器,所述注册器用于将传输任务注册为支持远程直接内存访问的格式;其中,所述传输任务中存储所述传输数据。3.根据权利要求2所述的系统,其特征在于,所述发送管理器还用于查看所述发送器及所述发送通道的状态,并向所述发送器反馈发送状态提醒,以使所述发送器根据所述发送状态提醒,通过所述传输任务获取所述传输数据。4.根据...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:中国人民银行清算总中心,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。