神经网络的结构确定方法、装置、设备及可读介质制造方法及图纸

技术编号:20390810 阅读:25 留言:0更新日期:2019-02-20 03:13
本公开实施例公开了一种神经网络的结构确定方法、装置、设备及可读介质。其中,方法包括:通过采样器采样出当前网络结构;计算当前网络结构的目标函数值;根据所述目标函数值调整所述采样器的参数;返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值。本公开实施例能够实现网络结构的自动搜索,不拘泥于一种固定的网络结构,而是通过目标函数值不断得到新的、质量更高的网络结构,能够适用于几乎各种场景的数据处理。

【技术实现步骤摘要】
神经网络的结构确定方法、装置、设备及可读介质
本公开实施例涉及计算机视觉技术,尤其涉及一种神经网络的结构确定方法、装置、设备及可读介质。
技术介绍
随着计算机视觉的发展,可以通过神经网络对图像、声音等数据进行处理,例如对图像中的对象进行目标检测、目标跟踪、分割和分类等。随着用户需求的提升和终端技术的发展,对数据处理的准确性和速度提出了更高的要求,这就需要一个处理效果较佳的神经网络。现有技术中,大多使用比较成熟的RCNN、TOLO、SSD等神经网络进行图像处理,但是,专利技术人在研究过程中发现,这些成熟的神经网络并不适用所有数据的处理,例如在处理某些图像时,这些神经网络的处理效果较差。
技术实现思路
本公开实施例提供一种神经网络的结构确定方法、装置、设备及可读介质,以实现网络结构的自动搜索,用于几乎各种场景的数据处理。第一方面,本公开实施例提供了一种神经网络的结构确定方法,包括:通过采样器采样出当前网络结构;计算当前网络结构的目标函数值;根据所述目标函数值调整所述采样器的参数;返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值。第二方面,本公开实施例还提供了一种神经网络的结构确定装置,包括:采样模块,用于通过采样器采样出当前网络结构;计算模块,用于计算当前网络结构的目标函数值;调整模块,用于根据所述目标函数值调整所述采样器的参数;返回模块,用于返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值。第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:一个或多个处理装置;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理装置实现任一实施例所述的神经网络的结构确定方法。第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现任一实施例所述的神经网络的结构确定方法。本公开实施例中,通过采样器采样出当前网络结构,并计算当前网络结构的目标函数值,从而通过目标函数值表征网络结构的质量;通过根据所述目标函数值调整所述采样器的参数,返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值,从而实现网络结构的自动搜索,而且,通过反复调整采样器的参数,以便采样器能够采样出质量更高的网络结构,从而在后续使用时能够得到较佳的结果。本公开实施例在具体应用场景中,不拘泥于一种固定的网络结构,而是通过目标函数值不断得到新的、质量更高的网络结构,能够适用于几乎各种场景的数据处理。附图说明图1是本公开实施例一提供的一种神经网络的结构确定方法的流程图;图2是本公开实施例二提供的一种神经网络的结构确定方法的流程图;图3a是本公开实施例三提供的一种神经网络的结构确定方法的流程图;图3b是本公开实施例三提供的预先定义的网络层编码的示意图;图3c是本公开实施例三提供的一种采样器的结构示意图;图3d是本公开实施例三提供的一种网络结构的示意图;图3e是本公开实施例三提供的另一种网络结构的示意图;图4是本公开实施例四提供的一种神经网络的结构确定装置的结构示意图;图5是本公开实施例五提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。实施例一图1是本公开实施例一提供的一种神经网络的结构确定方法的流程图,本实施例可适用于确定神经网络的结构的情况,该方法可以由神经网络的结构确定装置来执行,该装置可以由硬件和/或软件构成,并集成在电子设备中,该电子设备可以是服务器或者终端。结合图1,本公开实施例提供的方法具体包括如下操作:S110、通过采样器采样出当前网络结构。继续执行S120。采样器用于采样出神经网络的网络结构。每次运行采样器可采样出至少一个当前网络结构。S120、计算当前网络结构的目标函数值。继续执行S130。目标函数值用于表征当前网络结构的质量。以识别模型为例,目标函数值越高,识别模型的识别结果越准确。以分类模型为例,目标函数值越高,分类模型的置信度越大。可选地,通过至少一种元素构建目标函数,并计算当前网络结构的目标函数值。其中,构建目标函数的元素根据网络结构的实际需求决定,例如,网络结构需要运行在终端,要求其占用空间小,则元素包括网络结构的占用空间;又例如,要求网络结构具有较高的准确率,则元素包括网络结构的准确率。S130、判断目标函数值是否达到预设函数值,和/或调整次数是否达到次数阈值。如果是,跳转到S140;如果否,跳转到S150。本实施例采用预设函数值和次数阈值这两个因素中至少一种,作为循环的截止条件。可选地,可仅采用其中一种因素进行判断,另一种因素舍弃。例如判断目标函数值是否达到预设函数值,或者判断调整次数是否达到次数阈值。可选地,还可以综合两种因素进行判断,例如,同时判断目标函数值是否达到预设函数值,以及调整次数是否达到次数阈值,如果其中之一判断为是,则跳转到S140;如果两种因素均判断为否,即目标函数值未达到预设函数值,且调整次数未达到次数阈值,跳转到S150。在一具体实施方式中,如果目标函数值达到预设函数值,说明当前网络结构满足实际需求,进而将当前网络结构确定为最终的网络结构,以供后续使用。相反,如果目标函数未达到预设函数值,说明当前网络结构不满足实际需求,可以根据目标函数值调整采样器的参数,并继续采样出下一个网络结构;或者还可以继续判断调整次数是否达到次数阈值。这是因为,在有些情况下,经过很多次调整后,目标函数值依然不能达到预设函数值,为了节省时间和计算资源,如果调整次数达到次数阈值,将当前网络结构确定为最终的网络结构。如果调整次数未达到次数阈值,则根据目标函数值调整采样器的参数,并继续采样出下一个网络结构。S140、确定当前网络结构,并结束本次操作。S150、根据目标函数值调整采样器的参数。返回执行S110。可选地,如果预设函数值是一个较小的值,即目标函数值越小,说明当前网络结构的质量越高,则通过最小化目标函数值调整采样器的参数;如果预设函数值是一个较大的值,即目标函数值越大,说明当前网络结构的质量越高,则通过最大化目标函数值调整采样器的参数。可选地,参数调整方法包括但不限于策略梯度算法,梯度下降法等。通过调整采样器的参数,使得下一网络结构的目标函数值较当前网络结构的目标函数值更加接近预设函数值,从而有利于采样出质量更高的网络结构。本公开实施例中,通过采样器采样出当前网络结构,并计算当前网络结构的目标函数值,从而通过目标函数值表征网络结构的质量;通过根据目标函数值调整采样器的参数,返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值,从而实现网络结构的自动搜索,而且,通过反复调整采样器的参数,以便采样器本文档来自技高网...

【技术保护点】
1.一种神经网络的结构确定方法,其特征在于,包括:通过采样器采样出当前网络结构;计算当前网络结构的目标函数值;根据所述目标函数值调整所述采样器的参数;返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值。

【技术特征摘要】
1.一种神经网络的结构确定方法,其特征在于,包括:通过采样器采样出当前网络结构;计算当前网络结构的目标函数值;根据所述目标函数值调整所述采样器的参数;返回执行通过采样器采样出当前网络结构的操作,直到目标函数值达到预设函数值,和/或调整次数达到次数阈值。2.根据权利要求1所述的方法,其特征在于,所述计算当前网络结构的目标函数值,包括:计算当前网络结构的准确率和/或运行时长;根据当前网络结构的准确率和/或运行时长,得到目标函数值。3.根据权利要求2所述的方法,其特征在于,所述计算当前网络结构的准确率和运行时长,包括:采用训练集,训练当前网络结构的网络参数;采用验证集,计算网络结构的准确率;在终端运行当前网络结构,并获取当前网络结构的运行时长。4.根据权利要求3所述的方法,其特征在于,在所述采用验证集,计算当前网络结构的准确率之前,还包括:采用验证集,计算当前网络结构的损失值;根据所述损失值调整网络参数;返回执行损失值的计算操作,直到损失值低于损失阈值。5.根据权利要求3所述的方法,其特征在于,在终端运行当前网络结构,并获取当前网络结构的运行时长之前,还包括:将当前网络结构的网络参数和输入数据的格式转换为定点;将网络结构、定点格式的网络参数和输入数据提供至终端。6.根据权利要求2所述的方法,其特征在于,所述根据当前网络结构的准确率和运行时长,得到目标函数值,包括:根据公式计算当前网络结构m的目标函数值Q(m);其中,ACC(m)为当前网络结构m的准确率,t(m)为当前网络结构m的运行时长,T为常数,r为预设指数。7.根据权利要求1所述的方法,其特征在于,所述通过采样器采样出当前网络结构,包括:将预先定义的网络层编码输入至采样器中,得到当前网络结构编码;根据当前网络结构编码,构建当前网络结构;其中,当前网络结构编码包括:网络单元中网络层的编码、网络层的连接关系和网络单元的堆叠次数,所述当前网络结构包括:...

【专利技术属性】
技术研发人员:胡耀全
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1