目标检测中神经网络后处理实现方法、装置、终端及介质制造方法及图纸

技术编号:29791986 阅读:12 留言:0更新日期:2021-08-24 18:11
本发明专利技术公开了一种目标检测中神经网络后处理实现方法、装置、终端及介质所述方法包括:根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。本发明专利技术提供的目标检测中神经网络后处理实现方法,能够提高产品的可移植性,在保证精度的同时占用较少的资源,进而提升了计算效率。

【技术实现步骤摘要】
目标检测中神经网络后处理实现方法、装置、终端及介质
本专利技术涉及人工智能及深度学习
,具体涉及一种目标检测中神经网络后处理实现方法、装置、终端及介质。
技术介绍
在人工智能领域中,目标检测是计算机视觉和数字图像处理中比较热门的一个方向,能够广泛应用于工业检测,自动驾驶,安防监控等很多领域。其中,目标检测即检测图像中的物体类别及其在图像中的位置,往往基于神经网络依次进行预处理、特征提取及后处理等操作。在目前的神经网络应用中,大部分还是基于计算机平台,通过大型服务器完成训练及推断,而有小部分处理则是通过移动平台来实现,例如开发ASIC芯片,或在FPGA设计神经网络等,最终实现大大降低成本且方便使用的目的。然而,现有的基于FPGA实现的CNN神经网络的目标检测方案还尚未成熟,主要原因在于成本较高,即要求使用的FPGA芯片满足片上内存资源大、计算模块资源多、逻辑资源丰富、甚至带有CPU核等条件。因此,对于目标检测的后处理部分通常利用CPU处理,但是这种做法又会增加CPU和FPGA的交互复杂性,且会导致系统整体功耗增加。
技术实现思路
本专利技术的目的在于提供一种目标检测中神经网络后处理实现方法、装置、终端及介质,以解决现有目标检测过程中的神经网络后处理存在的成本高、交互复杂,系统能耗大的问题。为了克服上述现有技术中的缺陷,本专利技术提供了一种目标检测中神经网络后处理实现方法,包括:根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。进一步地,所述并行计算包括:所述延迟数据链与所述计算数据链之间的并行计算;所述延迟数据链中各模块之间的并行计算;所述计算数据链中各模块之间的并行计算。进一步地,所述流水式计算为:所述计算数据链中的各模块进行不间断进行计算及输出,直至所有所述待测数据计算完毕。进一步地,所述计算数据链中的每个模块用于进行加法或乘法运算。进一步地,所述目标检测中神经网络后处理实现方法,还包括:将logistic回归函数化简为logistic分段函数;对所述logistic分段函数进行拟合,得到所述logistic分段函数的多项式形式。进一步地,所述后处理实现方法基于FPGA。本专利技术还提供了一种目标检测中神经网络后处理实现装置,包括:数据获取模块,用于根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;并行计算模块,用于将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。进一步地,所述目标检测中神经网络后处理实现装置,还包括模型构建单元,用于,将logistic回归函数化简为logistic分段函数;对所述logistic分段函数进行拟合,得到所述logistic分段函数的多项式形式。本专利技术还提供了一种终端设备,包括:一个或多个处理器;存储器,与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上任一项所述的目标检测中神经网络后处理实现方法。本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行实现如上任一项所述的目标检测中神经网络后处理实现方法。相对于现有技术,本专利技术的有益效果在于:本专利技术公开了一种目标检测中神经网络后处理实现方法,包括根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。本专利技术提供的目标检测中神经网络后处理实现方法,基于单芯片FPGA进行设计,提高了方法的可移植性,更好的实现了IP化、产品化;通过分段拟合logistic函数得到多项式形式,保证了分类计算结果精度的同时占用了较少资源;通过并行计算与流水式计算相结合,使得数据源源不断的输入输出,无需特征缓存机制,大大提升了计算效率。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术某一实施例提供的目标检测中神经网络后处理实现方法的流程示意图;图2为本专利技术某一实施例提供的目标检测过程的原理示意图;图3为本专利技术某一实施例提供的目标检测后处理分类计算单元的结构示意图;图4为图3中分类计算单元中各个独立的数据链结构示意图;图5为本专利技术某一实施例提供的目标检测中神经网络后处理实现装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。应当理解,在本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。术语解释:CNN:是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(Shift-InvariantArtificialNeuralNetworks,SIANN)”。CPU:中央处理器(centralprocessingunit)FPGA:现场可编程门阵列第一方本文档来自技高网...

【技术保护点】
1.一种目标检测中神经网络后处理实现方法,其特征在于,包括:/n根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;/n将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。/n

【技术特征摘要】
20210421 CN 20211043218721.一种目标检测中神经网络后处理实现方法,其特征在于,包括:
根据logistic分段函数的多项式形式及分段区间,将所述多项式的浮点数类型系数转为定点数类型系数,得到待测数据;
将所述待测数据输入至分类计算单元进行并行计算及流水式计算;其中,所述分类计算单元包括延迟数据链及与所述定点数类型系数对应的计算数据链。


2.根据权利要求1所述的目标检测中神经网络后处理实现方法,其特征在于,所述并行计算包括:
所述延迟数据链与所述计算数据链之间的并行计算;
所述延迟数据链中各模块之间的并行计算;
所述计算数据链中各模块之间的并行计算。


3.根据权利要求1所述的目标检测中神经网络后处理实现方法,其特征在于,所述流水式计算为:
所述计算数据链中的各模块进行不间断进行计算及输出,直至所有所述待测数据计算完毕。


4.根据权利要求1所述的目标检测中神经网络后处理实现方法,其特征在于,所述计算数据链中的每个模块用于进行加法或乘法运算。


5.根据权利要求1所述的目标检测中神经网络后处理实现方法,其特征在于,还包括:
将logistic回归函数化简为logistic分段函数;
对所述logistic分段函数进行拟合,得到所述logistic分段函数的多...

【专利技术属性】
技术研发人员:马成森边立剑
申请(专利权)人:上海安路信息科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1