神经网络更新方法、装置、计算机设备和可读存储介质制造方法及图纸

技术编号:19824231 阅读:42 留言:0更新日期:2018-12-19 15:35
本发明专利技术涉及一种神经网络更新方法,所述方法包括:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。本发明专利技术方案能够避免神经网络在不断更新时出现过度拟合。

【技术实现步骤摘要】
神经网络更新方法、装置、计算机设备和可读存储介质
本专利技术涉及计算机
,特别是涉及一种神经网络更新方法、装置、计算机设备和可读存储介质。
技术介绍
在机器学习和相关领域,人工神经网络的计算模型通常被用于估计或可以依赖于大量的输入和一般的未知近似函数。人工神经网络通常呈现为相互连接的“神经元”,它可以从输入的计算值,并且能够机器学习以及模式识别由于它们的自适应性质的系统。当训练神经网络的数据不断更新时,神经网络也会随之更新,但由于训练数据不断学习,随着迭代次数的增加,拟合了训练数据中的噪音,必然会导致产生过拟合的现象。目前还没有可以避免神经网络不断更新时会产生过度拟合的技术。
技术实现思路
本专利技术的目的在于提供一种神经网络更新方法、装置计算机设备和可读存储介质,能够消除神经网络不断更新过程导致的过度拟合。本专利技术的目的通过如下技术方案实现:一种神经网络更新方法,所述方法包括:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。在其中一个实施例中,所述获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络包括:获取当前更新数据,抽取初始神经网络中预设比例的神经元获得第一神经元集合,将所述初始神经网络中未被抽取的神经元集合作为第二神经元集合;获取所述初始神经网络的当前网络参数,根据所述当前网络参数和所述第一神经元集合获取所述第一神经网络。在其中一个实施例中,所述结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络包括:将所述初始神经网络中的所述第一神经元集合更新为所述第三神经元集合,获得目标神经网络。在其中一个实施例中,所述目标神经网络的网络参数和所述初始神经网络的当前网络参数相同。在其中一个实施例中,所述预设比例根据所述当前更新数据的数据量确定。一种神经网络更新装置,所述装置包括:第一获取模块,用于获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;第二获取模块,用于根据所述当前更新数据训练所述第一神经网络获得第二神经网络;第三获取模块,用于获取所述第二神经网络的第三神经元集合;第四获取模块,用于结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。在其中一个实施例中,所述第一获取模块包括:第一获取单元,用于获取当前更新数据,抽取初始神经网络中预设比例的神经元获得第一神经元集合,将所述初始神经网络中未被抽取的神经元集合作为第二神经元集合;第二获取单元,用于获取所述初始神经网络的当前网络参数,根据所述当前网络参数和所述第一神经元集合获取所述第一神经网络。在其中一个实施例中,所述第四获取模块具体用于将所述初始神经网络中的所述第一神经元集合更新为所述第三神经元集合获得目标神经网络。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。根据上述本专利技术的方案,其获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络,根据所述当前更新数据训练所述第一神经网络获得第二神经网络,只更新初始神经网络中的第一神经元集合,可以避免整个初始神经网络都被更新;获取所述第二神经网络的第三神经元集合,结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络,初始神经网络中的第一神经元集合被替换为第三神经元集合,第二神经元集合保持不变,可以保证神经网络的参数不会被不断更新的数据改变到面目全非,能有效避免过度拟合。附图说明图1为一个实施例中神经网络更新方法的应用环境图;图2为一个实施例中神经网络更新方法的流程示意图;图3为另一个实施例中神经网络更新方法的流程示意图;图4为一个实施例中神经网络更新装置的结构框图;图5为另一个实施例中神经网络更新装置的结构框图;图6为一个实施例中计算机设备的内部结构图;图7为另一个实施例中计算机设备的内部结构图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。图1为一个实施例中服务器的内部结构示意图。该服务器包括通过系统总线连接的处理器、非易失性存储介质、网络接口、内存储器、输入装置。其中该服务器的非易失性存储介质有操作系统,还包括一种神经网络更新装置,该神经网络更新装置用于实现一种神经网络更新方法。该处理器用于提供计算和控制能力,支撑整个服务器的运行。服务器中的内存储器为非易失性存储介质中的神经网络更新装置的运行提供环境,网络接口用于与其他服务器或终端进行通信,如当服务器响应点击操作可以产生控制命令发送到其它服务器或者终端等。输入装置为键盘、鼠标或触摸屏等。具体的,服务器获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;服务器根据所述当前更新数据训练所述第一神经网络获得第二神经网络;服务器获取所述第二神经网络的第三神经元集合;服务器结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,本申请提供的神经网络更新方法,不仅可以应用于图1所示的应用环境中,还可以应用但不限于各种计算机或服务器中。在一个实施例中,如图2所示,提供了一种神经网络更新方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤S101,获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;例如,初始神经网络中有1000个神经元,那抽取500个作为第一神经元集合,然后初始神经网络的其他参数不变,仅仅是原来的1000个神经元变成现在的500个的第一神经元集合。步骤S102,根据所述当前更新数据训练所述第一神本文档来自技高网...

【技术保护点】
1.一种神经网络更新方法,其特征在于,所述方法包括:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。

【技术特征摘要】
1.一种神经网络更新方法,其特征在于,所述方法包括:获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络;根据所述当前更新数据训练所述第一神经网络获得第二神经网络;获取所述第二神经网络的第三神经元集合;结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络。2.根据权利要求1所述的神经网络更新方法,其特征在于,所述获取当前更新数据、初始神经网络的第一神经元集合和第二神经元集合,结合所述初始神经网络和所述第一神经元集合获取第一神经网络包括:获取当前更新数据,抽取初始神经网络中预设比例的神经元获得第一神经元集合,将所述初始神经网络中未被抽取的神经元集合作为第二神经元集合;获取所述初始神经网络的当前网络参数,根据所述当前网络参数和所述第一神经元集合获取所述第一神经网络。3.根据权利要求1所述的神经网络更新方法,其特征在于,所述结合所述初始神经网络、所述第二神经元集合和所述第三神经元集合获取目标神经网络包括:将所述初始神经网络中的所述第一神经元集合更新为所述第三神经元集合,获得目标神经网络。4.根据权利要求2所述的神经网络更新方法,其特征在于,所述目标神经网络的网络参数和所述初始神经网络的当前网络参数相同。5.根据权利要求2所述的神经网络更新方法,其特征在于,所述预设比例根据所述当前更新数据的数据量确定。6...

【专利技术属性】
技术研发人员:杜翠凤温云龙杨旭周善明张添翔叶绍恩梁晓文
申请(专利权)人:广州杰赛科技股份有限公司广州杰赛通信规划设计院有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1