模型处理方法及装置制造方法及图纸

技术编号:39137737 阅读:8 留言:0更新日期:2023-10-23 14:53
本申请公开了一种模型处理方法及装置,属于神经网络技术领域,本申请实施例的模型处理方法,包括:在大闭环级联模型的训练过程中,根据维护的神经元参数的二维权重图生成神经元离散图,所述二维权重图记录所述大闭环级联模型的原子能力各个神经元参数的原子权重和闭环权重;周期性生成伪随机序列,所述伪随机序列的长度与所述二维权重图的权重值的数目相等;将所述伪随机序列与所述神经元离散图进行异或操作,根据操作结果对所述神经元进行剪枝。本申请实施例能够增加体系化人工智能系统的安全性。的安全性。的安全性。

【技术实现步骤摘要】
模型处理方法及装置


[0001]本申请属于神经网络
,具体涉及一种模型处理方法及装置。

技术介绍

[0002]人工智能(AI)作为新一轮科技革命的引领性技术之一,已经成为推动人类科技发展、实现产业升级的主导力量。随着人工智能技术在全球各地、各行各业的广泛应用,以及各项人工智能基础设施的构建,其面临的安全风险愈发严重。因此,人工智能安全性的研究,重要性愈发凸显,已经成为了保障人工智能高质量发展的重要基石。

技术实现思路

[0003]本申请实施例提供一种模型处理方法及装置,能够增加体系化人工智能系统的安全性。
[0004]本申请实施例提供一种模型处理方法,包括:
[0005]在大闭环级联模型的训练过程中,根据维护的神经元参数的二维权重图生成神经元离散图,所述二维权重图记录所述大闭环级联模型的原子能力各个神经元参数的原子权重和闭环权重;
[0006]周期性生成伪随机序列,所述伪随机序列的长度与所述二维权重图的权重值的数目相等;
[0007]将所述伪随机序列与所述神经元离散图进行异或操作,根据操作结果对所述神经元进行剪枝。
[0008]一些实施例中,所述方法还包括:
[0009]在大闭环级联模型的训练过程中,获取每一所述原子能力各个神经元参数的原子权重和闭环权重,根据所述原子权重和所述闭环权重建立所述二维权重图,所述原子权重为原子能力自身达到模型性能指标时,神经元参数在整个模型结构中的权重,所述闭环权重为在大闭环优化中,达到端到端业务的级联优化性能指标时所述神经元参数的权重。
[0010]一些实施例中,所述根据维护的神经元参数的二维权重图生成神经元离散图包括:
[0011]将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于或等于所述设定阈值的权重值在所述神经元离散图中保存为1,小于所述设定阈值的权重值在所述神经元离散图中保存为0;或
[0012]将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于所述设定阈值的权重值在所述神经元离散图中保存为1,小于或等于所述设定阈值的权重值在所述神经元离散图中保存为0。
[0013]一些实施例中,根据操作结果对神经元进行剪枝包括:
[0014]对异或操作后、操作结果为0对应的神经元进行剪枝。
[0015]一些实施例中,所述方法还包括更新所述二维权重图,所述二维权重图中,权重值
大的神经元参数的更新频率低于权重值小的神经元参数的更新频率。
[0016]本申请实施例提供了一种模型处理装置,包括:
[0017]处理模块,用于在大闭环级联模型的训练过程中,根据维护的神经元参数的二维权重图生成神经元离散图,所述二维权重图记录所述大闭环级联模型的原子能力各个神经元参数的原子权重和闭环权重;
[0018]生成模块,用于周期性生成伪随机序列,所述伪随机序列的长度与所述二维权重图的权重值的数目相等;
[0019]剪枝模块,用于将所述伪随机序列与所述神经元离散图进行异或操作,根据操作结果对所述神经元进行剪枝。
[0020]一些实施例中,所述处理模块还用于在大闭环级联模型的训练过程中,获取每一所述原子能力各个神经元参数的原子权重和闭环权重,根据所述原子权重和所述闭环权重建立所述二维权重图,所述原子权重为原子能力自身达到模型性能指标时,神经元参数在整个模型结构中的权重,所述闭环权重为在大闭环优化中,达到端到端业务的级联优化性能指标时所述神经元参数的权重。
[0021]一些实施例中,所述处理模块具体用于将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于或等于所述设定阈值的权重值在所述神经元离散图中保存为1,小于所述设定阈值的权重值在所述神经元离散图中保存为0;或
[0022]将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于所述设定阈值的权重值在所述神经元离散图中保存为1,小于或等于所述设定阈值的权重值在所述神经元离散图中保存为0。
[0023]一些实施例中,所述剪枝模块具体用于对异或操作后、操作结果为0对应的神经元进行剪枝。
[0024]一些实施例中,所述处理模块还用于更新所述二维权重图,所述二维权重图中,权重值大的神经元参数的更新频率低于权重值小的神经元参数的更新频率。
[0025]本申请实施例提供了一种模型处理装置,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上所述的模型处理方法的步骤。
[0026]本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上所述的模型处理方法的步骤。
[0027]在本申请实施例中,根据维护的神经元参数的二维权重图生成神经元离散图,根据伪随机序列与神经元离散图进行异或操作的结果对神经元进行剪枝,使得在大闭环级联模型中的原子能力具备神经元链接层面的随机跳变性,能够实现体系化AI在运行及优化过程中的防攻击,增加系统的安全性。
附图说明
[0028]图1是原子能力拆解及大闭环AI的示意图;
[0029]图2是特定的后门神经元的示意图;
[0030]图3是本申请实施例模型处理方法的流程示意图;
[0031]图4是本申请实施例二维权重图的示意图;
[0032]图5是本申请实施例更新二维权重图的示意图;
[0033]图6是本申请实施例生成神经元离散图的示意图;
[0034]图7是本申请实施例模型处理装置的结构示意图;
[0035]图8是本申请实施例模型处理装置的组成示意图。
具体实施方式
[0036]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
[0037]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
[0038]现有的可信AI技术方案和策略中,主要存在着以下几类问题:
[0039]1.白皮书类的政策性安全可信AI建议,只是为人工智能的安全提供了一个宏观的蓝图,缺乏针对具体的AI子领域和具体问题,提供相应的针对性指导。
[0040]2.企业在针对人工智能的安全性研究时,往往侧重于具体某个子方向的研究,这样的点状防御策略使得难以对AI产品的全生命周期提供全程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法,其特征在于,包括:在大闭环级联模型的训练过程中,根据维护的神经元参数的二维权重图生成神经元离散图,所述二维权重图记录所述大闭环级联模型的原子能力各个神经元参数的原子权重和闭环权重;周期性生成伪随机序列,所述伪随机序列的长度与所述二维权重图的权重值的数目相等;将所述伪随机序列与所述神经元离散图进行异或操作,根据操作结果对所述神经元进行剪枝。2.根据权利要求1所述的模型处理方法,其特征在于,所述方法还包括:在大闭环级联模型的训练过程中,获取每一所述原子能力各个神经元参数的原子权重和闭环权重,根据所述原子权重和所述闭环权重建立所述二维权重图,所述原子权重为原子能力自身达到模型性能指标时,神经元参数在整个模型结构中的权重,所述闭环权重为在大闭环优化中,达到端到端业务的级联优化性能指标时所述神经元参数的权重。3.根据权利要求1所述的模型处理方法,其特征在于,所述根据维护的神经元参数的二维权重图生成神经元离散图包括:将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于或等于所述设定阈值的权重值在所述神经元离散图中保存为1,小于所述设定阈值的权重值在所述神经元离散图中保存为0;或将所述二维权重图中,神经元参数对应的权重值与设定阈值进行比较,大于所述设定阈值的权重值在所述神经元离散图中保存为1,小于或等于所述设定阈值的权重值在所述神经元离散图中保存为0。4.根据权利要求3所述的模型处理方法,其特征在于,根据操作结果对神经元进行剪枝包括:对异或操作后、操作结果为0对应的神经元进行剪枝。5.根据权利要求1所述的模型处理方法,其特征在于,所述方法还包括更新所述二维权重图,所述二维权重图中,权重值大的神经元参数的更新频率低于权重值小的神经元参数的更新频率。6.一种模型处理装置,其特征在于,包括:处理模块,用于在大闭环级联模型的训练过程中,根据维护的神经元参数的二维权重图生成神经元离散图,所述二维权重图记录所述大闭环级联模型的原子能力各个神经元参数的...

【专利技术属性】
技术研发人员:韩雪冯俊兰
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1