一种计算机图像处理硬件加速模块制造技术

技术编号:36441892 阅读:16 留言:0更新日期:2023-01-20 22:59
本申请公开了一种计算机图像处理硬件加速模块,包括模块印制板,模块印制板上设置有智能处理器、MCU、BMC子模块;智能处理器和MCU之间通过电平转换芯片电性连接,BMC子模块通过XMC连接器电性连接于模块印制板;模块印制板和计算机主板分别通过VPX连接器电性连接于底板。温度传感器通过I2C总线与MCU连接,BMC子模块的网络管理接口电性连接于VPX连接器,MCU通过AD采集口采集电压、电流模拟信号。整板电流通过电流采集芯片转换成模拟电压信号,MCU通过AD采集口接收转换后的电压信号。本申请基于全国产元器件,智能处理器神经网络模型采用yolov3,单套设备可满足同时处理4路视频数据要求;此外本装置可靠性高、抗干扰能力强,应用范围广。范围广。范围广。

【技术实现步骤摘要】
一种计算机图像处理硬件加速模块


[0001]本技术属于图像信息处理
,特别是涉及一种计算机图像处理硬件加速模块。

技术介绍

[0002]视觉是人类获取和处理外部信息的最重要途径,使用计算机进行视觉信息处理,其主要信息来源于利用各类传感器获得的图像。随着科技的发展,图像处理和分析技术在工业、医学、通信、教育、娱乐等方面得到了广泛的应用,极大地提高了人们的生活水平并且加快了社会的发展。广义的图像处理技术是对各类图像变换、分析和理解的技术的总称,狭义的图像处理技术主要包括图像获取、图像表示、图像压缩编码、图像分割、图像增强、图像复原等方面。图像的种类繁多,图像中的信息携带量巨大,现有国产设备在对图像进行复杂处理时,计算量巨大,同时需要耗费相当长的时间。
[0003]随着图像处理技术的进步,在各类实际生产生活中的应用越来越多,如门禁系统中的车牌识别技术,安防系统中的指纹识别和人脸识别等等。其对图像的质量、处理精度的要求越来越高,图像处理算法的复杂度提高的同时带来的计算工作量也越来越大。虽然如今硬件发展迅速,却也难以满足处理日益增加的图像处理计算需求,现有AI硬件加速模块在图像处理方面存在优势,但是在智能计算速率上不是强项,常温下的半精度浮点运算速度只有15TFLOPS。图像处理中许多算法是求确定的目标函数在特定图像数据下的最优解,其实质是一个函数优化问题。使用智能优化算法能够在保持图像处理准确性与精度的同时大幅度降低其时间复杂度。计算性能高、传输性能高(包括网络传输带宽高、传输时延低、处理器资源占用率低)、数据交互块已成为图像处理的发展趋势。

技术实现思路

[0004]本技术的目的在于解决现有AI硬件加速模块智能计算速率交底,在对图像进行复杂处理时,计算量巨大,需要耗费较长时间的问题。
[0005]为实现上述目的,本技术提供如下技术方案:一种计算机图像处理硬件加速模块,包括模块印制板,模块印制板上设置有智能处理器、MCU、BMC子模块;智能处理器和MCU之间通过电平转换芯片电性连接,BMC子模块通过XMC连接器电性连接于模块印制板;模块印制板和计算机主板分别通过VPX连接器电性连接于底板。
[0006]进一步地,模块印制板上设置有数个内存存储器组,各内存存储器组相互独立,且分别与智能处理器电性连接。
[0007]进一步地,温度传感器通过I2C总线与MCU连接,BMC子模块的网络管理接口电性连接于VPX连接器,MCU通过AD采集口采集电压、电流模拟信号。
[0008]进一步地,整板电流通过电流采集芯片转换成模拟电压信号,MCU通过AD采集口接收转换后的电压信号。
[0009]进一步地,智能处理器的供电通过DC/DC芯片提供,DC/DC芯片将12V电转换成智能
处理芯片需要的0.8V、1.2V、1.8V电源。
[0010]进一步地,VPX连接器P0通过机箱电源板输入12V主电源及5V辅电源。
[0011]进一步地,智能处理器采用yolov3神经网络模型。
[0012]进一步地,智能处理器电性连接于晶振。
[0013]与现有技术相比,本技术的有益效果是:1)基于全国产元器件;2)智能处理器神经网络模型采用yolov3,大小为416
×
416,启动32个核,单套设备可满足同时处理4路视频数据要求;3)可靠性高、抗干扰能力强;4)应用范围广。
[0014]为更清楚说明本技术的功能特性以及结构参数,下面结合附图及具体实施方式进一步说明。
附图说明
[0015]此处所说明的附图用来提供对本技术的进一步理解,构成本申请的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0016]图1为一种计算机图像处理硬件加速模块的原理框图;
[0017]图2为一种计算机图像处理硬件加速模块智能处理器和MCU数据交互设计图;
[0018]图3为一种计算机图像处理硬件加速模块智能处理器供电图;
[0019]图4为一种计算机图像处理硬件加速模块的图像处理效果图。
具体实施方式
[0020]下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例;基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0021]如图1所示,模块印制板上设置有智能处理器,MCU,BMC子模块,智能处理器和MCU之间通过电平转换芯片电性连接,BMC子模块通过XMC连接器电性连接于模块印制板;模块印制板和计算机主板分别通过VPX连接器电性连接于底板,智能处理器通过一路PCIE2.0中的x8连接至VPX连接器,PCIE2.0总线的标准时钟信号为100MHZ,并连接至临近的计算机主板CPU实现业务数据流的管控和调度。输入的图像信息,在CPU上做完预处理流程,然后进入到智能处理器做神经网络推理,推理结果最后拷贝回CPU。MCU用于整板的电源管理和板卡复位和温度监控等功能,主要包括用MCU来控制电源上电顺序、检测温度传感器返回值,并且当温度超过预设值时来关断电源转换芯片完成断电保护。BMC子模块用于实现对外管理接口(BMC对外提供两路I2C接口和管理网络)和硬件监测(主板温度、电压监测)功能,BMC子模块还控制智能模块的主电源上电,实现智能模块的电源在线控制。其中,SPI:串行通信总线的一种,图中的箭头代表方向;RST#:复位信号;Power_EN:上电使能信号;GPIO:普通输入输出口;IPMB:串行通信总线的一种;GAP:槽位信号,用于识别板卡在机箱的位置。
[0022]具体地,在本实施例中,智能处理器采用国产的寒武纪智能处理器CZ

210,工作频率为1GHz,常温下的半精度浮点运算速度不低于15TFLOPS,内存容量为32GB。智能处理器神经网络模型采用yolov3,大小为416
×
416,启动32个核,单套设备可满足同时处理4路视频
数据要求。MCU采用中电58所的CS32F103CB芯片,MCU预留引脚以便后续添加其他功能。
[0023]具体地,在本实施例中,模块印制板上设置有4组独立的DDR4内存存储器组,内存颗粒选用合肥长鑫存储技术有限公司的CXDQ3A8AM

WG,数据总线设计的峰值速率为2666Mbps,每组外置8+1颗DDR4内存颗粒,总容量为32GB。位宽为72bit(64bit数据+8bit ECC),总位宽为256bit。智能处理器外部的4组DDR4存储器组相互独立,每组的设计方法相同。智能处理器电性连接于晶振,智能处理器的时钟需求信号为25MHZ。
[0024]具体地,在本实施例中,BMC子模块通过中航光电的高速XMC连接器和模块印制板相连,BMC子模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机图像处理硬件加速模块,包括模块印制板,其特征在于,所述模块印制板上设置有智能处理器、MCU、BMC子模块;所述智能处理器和MCU之间通过电平转换芯片电性连接,所述BMC子模块通过XMC连接器电性连接于模块印制板;模块印制板和计算机主板分别通过VPX连接器电性连接于底板。2.根据权利要求1所述的一种计算机图像处理硬件加速模块,其特征在于,所述模块印制板上设置有数个内存存储器组,各内存存储器组相互独立,且分别与智能处理器电性连接。3.根据权利要求1所述的一种计算机图像处理硬件加速模块,其特征在于,温度传感器通过I2C总线与MCU连接,BMC子模块的网络管理接口电性连接于VPX连接器,MCU通过AD采集口采集电压、电流模拟信号。4.根据权利要求3所述的一种...

【专利技术属性】
技术研发人员:邹波王冶刘建新杨雪李轶朱梓铭邓超
申请(专利权)人:中国船舶集团有限公司第七一六研究所
类型:新型
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1