【技术实现步骤摘要】
一种基于嵌入-混合的轨迹数据增强及轨迹识别方法
本专利技术涉及信息
,更具体涉及运动轨迹数据的处理和识别。
技术介绍
数据增强技术是机器学习、数据挖掘领域中一项常见的数据处理手段,其核心思想是通过多重手段人工合成新的训练数据来增强算法模型效果。近年来,随着深度学习的迅猛发展,人们对可用于深度神经网络训练的数据需求也急剧增加。现有的机器学习的学习过程依据是经验风险最小化,利用经验(训练数据)去不断逼近参数空间的最优值(即当训练数据足够多的情况下,模型可以足够近似的逼近真实数据集的分布)。然而,由于受数据采集、专业领域知识限制,大规模的增加训练数据是高成本甚至是不可行的,这样也催生了人工合成训练数据,即数据增强方法需求的诞生。数据增强方法可以按照处理数据的类别不同划分为两大类基本手段,即图像数据增强以及序列数据增强;根据不同的实现方法,可以分为变换增强,噪声叠加增强,替换增强等。在图像数据增强领域,现有的数据增强的方法主要分为三大类。第一类是以变换为基础的图片数据增强,常见的变换有旋转、翻折。第二类是以噪声叠加为基 ...
【技术保护点】
1.一种基于嵌入-混合的轨迹数据增强方法,其特征在于,所述方法包括:/nS1、将轨迹数据中的每条轨迹转换成相应感兴趣点的集合;/nS2、基于所有感兴趣点的总集计算包含每个感兴趣点编码的嵌入矩阵,所述感兴趣点编码包含相应感兴趣点的上下文信息;/nS3、基于所述嵌入矩阵确定每一条轨迹的轨迹编码向量;/nS4、对任意两条或更多条轨迹的编码向量进行加权融合,获得新的编码向量;/nS5、按照步骤S3的逆过程,对所获得的编码向量进行解码获得新的轨迹数据。/n
【技术特征摘要】
1.一种基于嵌入-混合的轨迹数据增强方法,其特征在于,所述方法包括:
S1、将轨迹数据中的每条轨迹转换成相应感兴趣点的集合;
S2、基于所有感兴趣点的总集计算包含每个感兴趣点编码的嵌入矩阵,所述感兴趣点编码包含相应感兴趣点的上下文信息;
S3、基于所述嵌入矩阵确定每一条轨迹的轨迹编码向量;
S4、对任意两条或更多条轨迹的编码向量进行加权融合,获得新的编码向量;
S5、按照步骤S3的逆过程,对所获得的编码向量进行解码获得新的轨迹数据。
2.根据权利要求1所述的轨迹数据增强方法,其特征在于,所述步骤S1包括:
基于所有轨迹数据确定感兴趣点的总集;
对于任意一条轨迹,提取轨迹中的感兴趣点,将所述轨迹表示为感兴趣点的集合。
3.根据权利要求1所述的轨迹数据增强方法,其特征在于,所述步骤S2包括:
对感兴趣点总集中的每个感兴趣点进行独热编码;
在轨迹数据中,对于每个感兴趣点提取其相邻感兴趣点的信息,并将相邻感兴趣点的信息与该感兴趣点的信息构成语料对;
构建用于感兴趣点信息编码的学习网络,将所述语料对作为所述学习网络的输入对该学习网络进行训练,将所述学习网络的输出层参数作为相应感兴趣点的向量编码;
将所有的感兴趣点对应的向量编码拼接为嵌入矩阵。
4.根据权利要求1所述的轨迹数据增强方法,其特征在于,所述步骤S3包括:
确定每一条轨迹中的感兴趣点;
将所确定的感兴趣点映射到所述嵌入矩阵中,获得该条轨迹中各感兴趣点对应的编码向量。
5.根据权利要求4所述的轨迹数据增强方法,其特征在于,所述步骤S3还包括:
将所获得的编码向量输入到长短时记忆网络,按该条轨迹中行经各感兴趣点的时间顺序,获得该条轨迹的输出向量以及隐藏向量;
对长短时记忆网络的输出进行随机擦除;
利用全连接层对前述步骤中的输出进行整合;
利用注意力层对全连接层输出的各个向量进行加权,获得轨迹编码向量。
6.根据权利要求5所述的轨迹数据...
【专利技术属性】
技术研发人员:孙涛,吴琳,徐勇军,王飞,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。