适用于卷积神经网络前向传播的消息队列构建方法及装置制造方法及图纸

技术编号:25086805 阅读:27 留言:0更新日期:2020-07-31 23:30
本发明专利技术提供了一种适用于卷积神经网络前向传播的消息队列构建方法及装置,其中方法包括:服务端的输入队列接收客户端发送的数据,对接收到的数据分配唯一标识符,生成待处理数据;服务端的计算单元按照第一预设轮询间隔查询输入队列中的待处理数据中是否具有待消费的请求数据,如果查询到有待消费的请求数据,则将待消费的请求数据从输入队列中取出,将待消费的请求数据打包拷贝至计算单元;计算单元将待消费的请求数据按照预设尺寸进行整合,按照并行化运算方式进行卷积神经网络模型计算,得到处理后的数据;服务端的输出队列获取处理后的数据,将处理后的数据发送至客户端。

【技术实现步骤摘要】
适用于卷积神经网络前向传播的消息队列构建方法及装置
本专利技术涉及计算机
,尤其涉及一种适用于卷积神经网络前向传播的消息队列构建方法及装置。
技术介绍
在计算机科学中,消息队列是适用于进程间通信或同一进程的不同线程间的通信方式。消息队列提供了一种异步的通信协议,客户端向服务端发送消息后,由服务端将消息回收至消息队列中,再通过任务调度的方式对由消息的接受者接受消息并进行消费处理。卷积神经网络通过卷积层、池化层、激活函数(层)的堆叠实现高效的特征抽象工作,一方面卷积网络对输入数据尺度有固定要求,另一方面基于GPU的神经网络运算方案允许输入多个相同尺度的数据作为一个批进行并行化加速。然而,现有技术中的消息队列构建方法,GPU数据拷贝成本非常大,消息队列消费冗余很多,数据传递效率较低,因此,设计一种新的消息队列构建方案成为亟待解决的问题。
技术实现思路
本专利技术旨在提供一种克服上述问题之一或者至少部分地解决上述任一问题的适用于卷积神经网络前向传播的消息队列构建方法及装置。为达到上述目的,本专利技术的技本文档来自技高网...

【技术保护点】
1.一种适用于卷积神经网络前向传播的消息队列构建方法,其特征在于,包括:/n服务端的输入队列接收客户端发送的数据,对接收到的数据分配唯一标识符,生成待处理数据;/n所述服务端的计算单元按照第一预设轮询间隔查询所述输入队列中的待处理数据中是否具有待消费的请求数据,如果查询到有所述待消费的请求数据,则将所述待消费的请求数据从所述输入队列中取出,将所述待消费的请求数据打包拷贝至所述计算单元;/n所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,按照并行化运算方式进行卷积神经网络模型计算,得到处理后的数据;/n所述服务端的输出队列获取所述处理后的数据,将所述处理后的数据发送至客户端。/n

【技术特征摘要】
1.一种适用于卷积神经网络前向传播的消息队列构建方法,其特征在于,包括:
服务端的输入队列接收客户端发送的数据,对接收到的数据分配唯一标识符,生成待处理数据;
所述服务端的计算单元按照第一预设轮询间隔查询所述输入队列中的待处理数据中是否具有待消费的请求数据,如果查询到有所述待消费的请求数据,则将所述待消费的请求数据从所述输入队列中取出,将所述待消费的请求数据打包拷贝至所述计算单元;
所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,按照并行化运算方式进行卷积神经网络模型计算,得到处理后的数据;
所述服务端的输出队列获取所述处理后的数据,将所述处理后的数据发送至客户端。


2.根据权利要求1所述的方法,其特征在于,所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,按照并行化运算方式进行卷积神经网络模型计算包括:
所述计算单元根据输入的数据的通道数、宽、高值通过批处理的方式进行整合并进行并行化计算。


3.根据权利要求1所述的方法,其特征在于,所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,按照并行化运算方式进行卷积神经网络模型计算包括:
所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,依次经过至少两个预设卷积神经网络模型进行计算。


4.根据权利要求3所述的方法,其特征在于,所述计算单元将所述待消费的请求数据按照预设尺寸进行整合,依次经过至少两个预设卷积神经网络模型进行计算包括:
对单次获得得到的所述待消费的请求数据进行分层打包,为每组数据选取合适的模型多次调度,根据调度方式将数据处理方式转化为多个单模型场景进行批量数据处理,并通过模型间的链接降低重复拷贝次数,进行并行化运算。


5.根据权利要求1所述的方法,其特征在于,所述输出队列将所述处理后的数据发送至客户端包括:
所述输出队列将所述处理后的数据通过数据分发的方式发送至所述客户端。


6.根据权利要求1所述的方法,其特征在于,
所述计算单元将所述待消费的请求数据按照预设尺寸进行整合之前,还包括:
所述计算单元根据所述唯一标识符建立数据访问索引;
所述服务端的输出队列获取所述处理后的数据包括:
所述服务端的输出队列根据所述数据访问索引获取与所述唯一标识符对应的处理后的数据。


7.根据权利要求3所述的方法,其特征在于,所述计算单元将所述待消费的请求数据按照预设尺寸进行整合之前,还包括:
所述计算单元对每个所述卷积神经网络模型建立与所述唯一标识符匹配的标识索引方式。


8.根据权利要求3所述的方法,其特征在于,所述计算单元将所述待消费的请求数据按照预设尺寸进行整合包括:
所述计算单元根据实际运算内存分配量确定数据切片大小,并根据确定的切片大小将所述待消费的请求数据进行整合。


9.根据权利要求1所述的方法,其特征在于,还包括:
所述客户端按照按照第二预设轮询间隔根据所述唯一标识符...

【专利技术属性】
技术研发人员:朱洪锦邰阳范洪辉舒振球赵小荣
申请(专利权)人:江苏理工学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1