基于损失正则化的安全示险在线持续学习系统技术方案

技术编号:34204343 阅读:10 留言:0更新日期:2022-07-20 11:29
本发明专利技术公开了基于损失正则化的安全示险在线持续学习系统,属于持续学习系统技术领域,包括数据平台、应用平台、数据捕捉模块、数据识别模块、训练模块、数据读取模块、学习模型模块、损失函数模块和差分数据模块,其中,数据平台的输出端与数据捕捉模块相接,数据捕捉模块的输出端与数据识别模块相接,数据识别模块的输出端与数据读取模块相接。本发明专利技术提出的基于损失正则化的安全示险在线持续学习系统,基于损失正则化,将新旧知识拆分,最小化二者之间的差异,防止灾难性遗忘的问题,基于样本重现,保留部分具有代表性的样本OR知识库,与新数据一同训练,基于网络结构调整,用部分网络学习旧的任务,新的知识采用网络中其他部分存储。储。储。

Online continuous learning system of safety risk indication based on loss regularization

【技术实现步骤摘要】
基于损失正则化的安全示险在线持续学习系统


[0001]本专利技术涉及持续学习系统
,特别涉及基于损失正则化的安全示险在线持续学习系统。

技术介绍

[0002]传统做法中,当机器学习算法部署到应用端后,各公司仍持续产生新的数据,但当前模型已被固化,无法从新数据中获得新的知识。传统基于Fine

Tuning的二次训练,需要收集新的训练数据,这在联合学习数据隔离的场景下颇不现实。灾难性遗忘:持续产生的新数据不断训练会使以前习得的旧知识慢慢遗忘,若与任务高度相关的知识被遗忘则会导致性能出现灾难性的下降。参与方相互干扰:由于个参与方设备数量、种类等不同,天然存在固有的数据异构性,从而不同参与方产生的新数据之间存在一定的干扰。

技术实现思路

[0003]本专利技术的目的在于提供基于损失正则化的安全示险在线持续学习系统,基于损失正则化,将新旧知识拆分,最小化二者之间的差异,防止灾难性遗忘的问题,基于样本重现,保留部分具有代表性的样本OR知识库,与新数据一同训练,基于网络结构调整,用部分网络学习旧的任务,新的知识采用网络中其他部分存储,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:基于损失正则化的安全示险在线持续学习系统,包括数据平台、应用平台、数据捕捉模块、数据识别模块、训练模块、数据读取模块、学习模型模块、损失函数模块和差分数据模块,其中,数据平台的输出端与数据捕捉模块相接,数据捕捉模块的输出端与数据识别模块相接,数据识别模块的输出端与数据读取模块相接,数据读取模块的输出端与学习模型模块相接,学习模型模块的输出端分别与训练模块和损失函数模块相接,损失函数模块的输出端与差分数据模块相接,差分数据模块的输出端与应用平台相接,应用平台的输出端与数据平台相接。
[0005]进一步地,数据平台包括服务器、旧数据库、数据管理模块、新数据库和数据分配模块,旧数据库和数据管理模块的输入端与数据分配模块相接,数据分配模块的输入端与数据管理模块相接,数据管理模块通过服务器与应用平台相接。
[0006]进一步地,服务器用于应用平台的数据读取、复制、转移进行实时监测,进行实时数据管理模块的更新;
[0007]所述的旧数据库用于存储未进行训练旧数据;
[0008]所述的数据管理模块用于管理应用平台的旧数据和新数据,并且控制数据分配模块将获得旧数据和新数据分配模块至旧数据库和新数据库中;
[0009]所述的新数据库用于存放当机器学习算法后持续产生新的数据,且为经过训练后的新知识;
[0010]所述的数据分配模块用于确定应用平台发送数据,其中确定其训练数据,并与旧数据分开同步输送数据至旧数据库和新数据库内。
[0011]进一步地,数据捕捉模块用于捕捉机器学习算法部署到应用端后持续产生新的数据,并且新数据库和旧数据库自身的日志来判断变化的数据,在对源表进行insert、update或delete操作的同时就可以提取变化的数据,并且变化的数据被保存在数据库的变化表中提供给数据识别模块。
[0012]进一步地,数据识别模块用于调取捕捉模块所获得的变化数据,并对变化数据进行采集、清洗、转换并发送至通讯至训练模块,并且同步的记录变化数据的变化幅度并实时统计信息。
[0013]进一步地,训练模块用于变化数据输入至训练机器学习模型模块内,在训练的同时建立训练后以及训练前的数据集,数据集内的数据用来训练或者教会机器模型或者算法的标注数据,基于样本重现,保留部分具有代表性的样本OR知识库,与新数据一同训练,并且测试训练的数据提供公正的评估的数据,能得到快速高精度,高重复利用率的训练数据;
[0014]所述的数据读取模块用于抽取数据集内数据并上传数据,进行数据解包、后期清洗、数据关联,自动生成标准与学习模型模块共享的数据。
[0015]进一步地,学习模型模块提供数据交操控和监管建立其模型,充分利用新增时间序列所含信息增量的同时,控制时间序列数据容量,从而控制计算成本和计算机存储容量,并且训练模块的数据在学习模型模块中运行。
[0016]进一步地,损失函数模块在学习模型模块运行的机器学习算法都或多或少的依赖于对目标函数最大化或者最小化的过程,找出最小化的函数,根据最小化的函数将两者数据拆分,并且分别发送至差分数据模块内,最小化二者之间的差异,防止灾难性遗忘的问题优化的方向。
[0017]进一步地,差分数据模块处理模块接收并处理两路数据,通过与输入的初始新数据对比,找出在训练模块以及学习模型模块中两路数据中损失,更新针对所述特征的当前收益分数,并且生成针对训练特征向量的准确预测结果中的有用性,根据损失修正训练模块和学习模型模块。
[0018]进一步地,应用平台输出学习后的数据至数据平台内,并且每隔设定的时间将新数据库内存储的数据转移至旧数据库内存储,继续补充新的数据至新数据库内。
[0019]与现有技术相比,本专利技术的有益效果是:
[0020]1、本专利技术提出的基于损失正则化的安全示险在线持续学习系统,基于网络结构调整旧数据库存放部分网络学习旧的任务,新的知识采用网络中新数据库中存储,旧数据库和新数据库基于网络架构建立,并针对其数据特征点一一编码,其设备的端口直接与数据库连接,新的数据与旧的数据所建立的数据库直能够使用。
[0021]2、本专利技术提出的基于损失正则化的安全示险在线持续学习系统,训练模块用于变化数据输入至训练机器学习模型模块内,在训练的同时建立训练后以及训练前的数据集,数据集内的数据用来训练或者教会机器模型或者算法的标注数据,基于样本重现,保留部分具有代表性的样本OR知识库,与新数据一同训练,并且测试训练的数据提供公正的评估的数据,能得到快速高精度,高重复利用率的训练数据。
[0022]3、本专利技术提出的基于损失正则化的安全示险在线持续学习系统,损失函数模块在学习模型模块运行的机器学习算法都或多或少的依赖于对目标函数最大化或者最小化的过程,找出最小化的函数,根据最小化的函数将两者数据拆分,并且分别发送至差分数据模
块内,最小化二者之间的差异,防止灾难性遗忘的问题优化的方向,基于损失正则化,将新旧知识拆分,最小化二者之间的差异,防止灾难性遗忘的问题,基于样本重现,保留部分具有代表性的样本OR知识库,与新数据一同训练,基于网络结构调整,用部分网络学习旧的任务,新的知识采用网络中其他部分存储。
附图说明
[0023]图1为本专利技术的整体模块图;
[0024]图2为本专利技术的数据平台原理图;
[0025]图3为本专利技术的数据识别模块拓扑图;
[0026]图4为本专利技术的损失函数模块拓扑图;
[0027]图5为本专利技术的修正示意图;
[0028]图6为本专利技术的知识网络架构图;
[0029]图7为本专利技术的又一实施例图。
[0030]图中:1、数据平台;11、服务器;12、旧数据库;13、数据管理模块;14、新数据库;15、数据分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于损失正则化的安全示险在线持续学习系统,其特征在于,包括数据平台(1)、应用平台(2)、数据捕捉模块(3)、数据识别模块(4)、训练模块(5)、数据读取模块(6)、学习模型模块(7)、损失函数模块(8)和差分数据模块(9),其中,数据平台(1)的输出端与数据捕捉模块(3)相接,数据捕捉模块(3)的输出端与数据识别模块(4)相接,数据识别模块(4)的输出端与数据读取模块(6)相接,数据读取模块(6)的输出端与学习模型模块(7)相接,学习模型模块(7)的输出端分别与训练模块(5)和损失函数模块(8)相接,损失函数模块(8)的输出端与差分数据模块(9)相接,差分数据模块(9)的输出端与应用平台(2)相接,应用平台(2)的输出端与数据平台(1)相接。2.如权利要求1所述的基于损失正则化的安全示险在线持续学习系统,其特征在于,数据平台(1)包括服务器(11)、旧数据库(12)、数据管理模块(13)、新数据库(14)和数据分配模块(15),旧数据库(12)和数据管理模块(13)的输入端与数据分配模块(15)相接,数据分配模块(15)的输入端与数据管理模块(13)相接,数据管理模块(13)通过服务器(11)与应用平台(2)相接。3.如权利要求2所述的基于损失正则化的安全示险在线持续学习系统,其特征在于,服务器(11)用于应用平台(2)的数据读取、复制、转移进行实时监测,进行实时数据管理模块(13)的更新;所述的旧数据库(12)用于存储未进行训练旧数据;所述的数据管理模块(13)用于管理应用平台(2)的旧数据和新数据,并且控制数据分配模块(15)将获得旧数据和新数据分配模块至旧数据库(12)和新数据库(14)中;所述的新数据库(14)用于存放当机器学习算法后持续产生新的数据,且为经过训练后的新知识;所述的数据分配模块(15)用于确定应用平台(2)发送数据,其中确定其训练数据,并与旧数据分开同步输送数据至旧数据库(12)和新数据库(14)内。4.如权利要求2所述的基于损失正则化的安全示险在线持续学习系统,其特征在于,数据捕捉模块(3)用于捕捉机器学习算法部署到应用端后持续产生新的数据,并且新数据库(14)和旧数据库(12)自身的日志来判断变化的数据,在对源表进行insert、update或delete操作的同时就可以提取变化的数据,并且变化的数据被保存在数据库的变化表中提...

【专利技术属性】
技术研发人员:谢龙飞张跃坤陈树山王龙
申请(专利权)人:新智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1