一种基于增量学习和联邦学习的模型训练及部署方法技术

技术编号：37202109 阅读：31 留言：0更新日期：2023-04-20 22:57

本发明专利技术为解决目前常见的计算机视觉算法模型，基于用户现场的数据进行训练，训练学习过程中，存在训练速度效率低、遗忘已经过学习的旧数据以及数据量和多样性均有限，致使所得模型的准确率和泛化性低的技术问题，而提供一种基于增量学习和联邦学习的模型训练及部署方法。本发明专利技术基于增量学习进行模型训练和部署，每次只用保存新到达的数据和少量旧数据，并可以基于少量数据完成模型的训练和部署，通过加密处理获得权重文件，在保护用户数据隐私的前提下充分利用多用户的数据资源优势。的前提下充分利用多用户的数据资源优势。的前提下充分利用多用户的数据资源优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于增量学习和联邦学习的模型训练及部署方法

[0001]本专利技术属于计算机视觉算法
，具体涉及一种基于增量学习和联邦学习的模型训练及部署方法。

技术介绍

[0002]计算机视觉算法在安全生产智能监管领域应用较为广泛，例如人体检测、人员穿戴检测等。在这些算法模型的训练和部署过程中，往往涉及大量的用户隐私场景，且训练数据是以数据流的形式分批次到达，这就对算法模型的训练范式提出了新的要求。
[0003]在实际项目部署过程中，通常基于用户现场的数据进行模型的训练，以满足用户场景的要求。对每一个用户现场来说，常用的算法模型训练和部署方式有两种：一种是全量学习方式，即基于所有已知的数据重新进行模型训练并部署；另一种是采用迁移学习方法，利用旧数据训练得到的模型作为预训练模型，在新数据上训练得到新模型并部署。
[0004]对于数据分批次到达的任务，如果采用全量学习的方式，每次需要在所有数据上训练，训练速度较慢，效率很低，不利于模型的快速迭代和部署；如果采用迁移学习方法，模型倾向于在新数据上有好的表现，但会丢弃掉旧...

【技术保护点】

【技术特征摘要】
1.一种基于增量学习和联邦学习的模型训练及部署方法，其特征在于，包括以下步骤：步骤1：根据安全生产智能监管系统中用户的具体需求，确定算法类别和模型选型；步骤2：在M个用户各自的现场，定时分批次采集并标注用户数据，建立每个用户现场的N批次数据流；其中，M≥1，N≥1，且均为正整数；步骤3：在每个用户现场基于其前N批次全部数据流进行训练，得到每个用户的原始模型权重；步骤4：结合每个用户的现场情况，采用同态加密技术对每个用户的原始模型权重进行加密，并将加密后的模型权重发送回中央服务器；步骤5：中央服务器对接收到的模型权重进行解密，基于解密后的M个用户的原始模型权重进行安全聚合，获得更新权重后的统一模型权重，将更新后的模型权重加密后下发至每个用户各自的现场；步骤6：每个用户各自对更新后的模型权重进行解密，结合更新后的模型权重、选取的前N批次和第N+1批次数据中的部分数据，采用增量学习方法进行训练，得到微调后的新模型权重并部署到现场；步骤7：将前N+1批次的数据作为旧数据，采集第N+2批次的数据作为新数据，按照步骤4
‑
步骤6的方法进行学习训练，直至达到用户的具体需求精度，得到最终的部署模型并部署到现场。2.根据权利要求1所述的基于增量学习和联邦学习的模型训练及部署方法，其特征在于：步骤6中，所述增量学习方法基于回放方式，即在前N批次数据与第N+1批次中的数据中选取部分具有代表性的数据共同进行训练。...

【专利技术属性】
技术研发人员：李刚，符惠桐，王乐，梅建刚，
申请(专利权)人：西安翔迅科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人