一种类别增量行为识别模型构建方法及行为识别方法技术

技术编号:37179211 阅读:47 留言:0更新日期:2023-04-20 22:46
本发明专利技术公开了一种基于知识重要性的类别增量行为识别模型构建方法以及行为识别方法。本发明专利技术针对增量学习过程中灾难性遗忘和长尾数据集中类别不平衡的问题,首次提出了利用权重子集获得混合权重从而使教师模型自主识别重要性知识的判断方法,达到保留旧数据中的重要性知识,实现了在增量学习过程中,学生网络可以根据教师网络的判别效果自动更新自适应,从而在一定程度上缓解了灾难性遗忘问题;同时通过限制权重子集的范围,也解决了长尾数据集中类别不平衡的问题。中类别不平衡的问题。中类别不平衡的问题。

【技术实现步骤摘要】
一种类别增量行为识别模型构建方法及行为识别方法


[0001]本专利技术涉及人工智能领域,进一步涉及机器学习和行为识别领域,具体 涉及基于知识重要性的类别增量行为识别模型构建及行为识别方法。

技术介绍

[0002]传统的可穿戴行为识别主要采用固定识别模型,也就是利用已有的有标 签数据离线训练分类模型,并利用该分类模型对个体行为进行分类识别。这 类模型在很多方面都是固定的,比如划定的类别数等。但是在真实环境中, 人们面临的场景是动态的,随着时间的延续,遇到的类别是在不断增加的, 比如个体这段时间学会了跑步,过一段时间后又学会了游泳。如何在开放环 境中完成用户在不断学习、识别新的行为的过程中,保存对已学过的行为的 记忆是在行为识别领域的一个重要挑战。
[0003]增量学习是适应开放场景下动态变化的一种有效方法,其模型构建方式 类似于人类对新事物的学习适应能力。增量学习是指在学得模型后,当新的、 之前从没见过的训练数据出现时,模型仅需要对新数据的特征进行适度的更 新,而不必重新训练整个模型,并且先前学习到的有效信息不会遗忘。理想 情况下的增量学本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识重要性的类别增量行为识别模型构建方法,其特征在于,所述方法包括:步骤(1)、获取适于进行增量学习并且经过训练的第一模型;步骤(2)、对于原有数据{D1,

,D
b
‑1}中的每个样例,计算所述第一模型对每个样例的预测值,对所述预测值进行校验,获得所述第一模型关于每一类样例的判断准确度,并基于所述第一模型关于每一类样例的判断准确度形成所述第一模型对原有数据{D1,

,D
b
‑1}的知识重要性因子β;步骤(3)、基于所述知识重要性因子β构建损失函数,将所述损失函数代入所述第一模型,根据目标增量类别数目,对所述第一模型进行类别增量,作为第二模型。2.根据权利要求1所述的方法,其特征在于,所述第一模型基于下式计算其对每个样例的预测值:其中,T是超参数,表示为蒸馏的温度值;是中的元素,表示所述第一模型对样例x进行预测时的该样例属于各个类别的概率输出。3.根据权利要求2所述的方法,其特征在于,所述知识重要性因子β为:其中,表示第一模型对每个样例的预测值,代表在b
th
增量步骤中旧数据的类别数。4.根据权利要求1所述的方法,其特征在于,所述方法还包括对于基于样例所提取的特征向量进行余弦归一化。5.根据权利要求3所述的方法,其特征在于...

【专利技术属性】
技术研发人员:谷洋郭帅陈益强王记伟文世杰马媛
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1