一种基于零样本重放的增量学习方法技术

技术编号:39987246 阅读:20 留言:0更新日期:2024-01-09 01:59
本发明专利技术涉及一种基于零样本重放的增量学习方法,属于机器学习方法领域。该方法包括以下步骤:获取物联网设备的实时监控数据;构建物联网监控模型,利用所述物联网监控模型对所述监控数据进行预测得到预测后的监控数据;利用完善的标签体系对预测后的监控数据进行自动化标注;基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型;将标注后的监控数据输入训练好的物联网监控模型得到高亮显示的关键信息。该方法使用标注过的样本集进行模型训练,提高了模型抽取信息的准确率以及训练的效率;在增量学习过程中通过同时使用旧样本的样本特征和新样本,在避免产生灾难性遗忘的同时节省了数据存储的开销。

【技术实现步骤摘要】

本专利技术涉及机器学习方法领域,尤其涉及一种基于零样本重放的增量学习方法


技术介绍

1、结构化数据是一种常见的数据结构,常用于服务器和客户端之间的数据交换。在物联网监控告警业务中,物联网设备会产生大量的实时数据,如充电桩实时状态、交通灯实时状态等信息,因此使用轻量级的json格式数据实现服务器与各联网设备间的数据传输。为了使监控人员能够快速准确地发现关键信息,需要利用自然语言处理技术抽取关键信息并进行高亮显示。

2、为实现上述需求,目前常用的方法是用标注后的样本集训练模型,然后用该模型对实际数据进行预测。现有的样本集构建方法主要有两种,一种是人工方式,由标注人员对所有新数据进行标注形成样本集;另一种是基于翻译模型将一部分人工标注的数据作为源语言,先将源语言翻译为英语、俄语、德语等中间语言,再将中间语言翻译回源语言,从而将一份数据扩充成多份数据形成样本集。现有模型的训练方法主要基于训练样本集,在每次训练时输入新的样本,容易造成模型过度学习新知识,对旧知识造成灾难性遗忘。

3、现有技术主要存在以下缺陷,一是人工标注数据成本高、效率低、本文档来自技高网...

【技术保护点】

1.一种基于零样本重放的物联网信息抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述完善的标签体系包括一级分类、二级分类、三级分类、四级分类4个等级,所述四级分类具有相应的别名库;

3.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型包括:

4.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述将标注后的监控数据输入训练好的物联网监控模型得到高亮显示的关键信...

【技术特征摘要】

1.一种基于零样本重放的物联网信息抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述完善的标签体系包括一级分类、二级分类、三级分类、四级分类4个等级,所述四级分类具有相应的别名库;

3.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型包括:

4.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述将标注后的监控数据输入训练好的物联网监控模型得到高亮显示的关键信息包括:

5.根据权利要求3所述的基于零样本重放的物联网信息抽取方法,其特征在于,对所述物联网监控模型进行训练时,还包括如...

【专利技术属性】
技术研发人员:彭龙孟英谦纪沈江杨亮王嘉岩杜宏博李晓政李皓谢志豪张世超王文哲薛行王静阳
申请(专利权)人:中国兵器工业计算机应用技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1