【技术实现步骤摘要】
本专利技术涉及机器学习方法领域,尤其涉及一种基于零样本重放的增量学习方法。
技术介绍
1、结构化数据是一种常见的数据结构,常用于服务器和客户端之间的数据交换。在物联网监控告警业务中,物联网设备会产生大量的实时数据,如充电桩实时状态、交通灯实时状态等信息,因此使用轻量级的json格式数据实现服务器与各联网设备间的数据传输。为了使监控人员能够快速准确地发现关键信息,需要利用自然语言处理技术抽取关键信息并进行高亮显示。
2、为实现上述需求,目前常用的方法是用标注后的样本集训练模型,然后用该模型对实际数据进行预测。现有的样本集构建方法主要有两种,一种是人工方式,由标注人员对所有新数据进行标注形成样本集;另一种是基于翻译模型将一部分人工标注的数据作为源语言,先将源语言翻译为英语、俄语、德语等中间语言,再将中间语言翻译回源语言,从而将一份数据扩充成多份数据形成样本集。现有模型的训练方法主要基于训练样本集,在每次训练时输入新的样本,容易造成模型过度学习新知识,对旧知识造成灾难性遗忘。
3、现有技术主要存在以下缺陷,一是人工标注
...【技术保护点】
1.一种基于零样本重放的物联网信息抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述完善的标签体系包括一级分类、二级分类、三级分类、四级分类4个等级,所述四级分类具有相应的别名库;
3.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型包括:
4.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述将标注后的监控数据输入训练好的物联网监控模型
...【技术特征摘要】
1.一种基于零样本重放的物联网信息抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述完善的标签体系包括一级分类、二级分类、三级分类、四级分类4个等级,所述四级分类具有相应的别名库;
3.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述基于零样本重放的方法构建训练样本集对所述物联网监控模型进行训练得到训练好的物联网监控模型包括:
4.根据权利要求1所述的基于零样本重放的物联网信息抽取方法,其特征在于,所述将标注后的监控数据输入训练好的物联网监控模型得到高亮显示的关键信息包括:
5.根据权利要求3所述的基于零样本重放的物联网信息抽取方法,其特征在于,对所述物联网监控模型进行训练时,还包括如...
【专利技术属性】
技术研发人员:彭龙,孟英谦,纪沈江,杨亮,王嘉岩,杜宏博,李晓政,李皓,谢志豪,张世超,王文哲,薛行,王静阳,
申请(专利权)人:中国兵器工业计算机应用技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。