The invention discloses a trajectory data classification method based on generating antagonistic network. Firstly, the real trajectory data is input into generating antagonistic network, and the generated antagonistic network is trained to generate the simulation trajectory data with the same distribution as the real trajectory data by the generator. Then, several groups of simulation are generated by the generator of generating antagonistic network. Trajectory data; it is better to classify and process several groups of simulated trajectory data together with real trajectory data to get trajectory user mapping. The invention can simulate the distribution of real trajectory data by generating confrontation network, and classifies the trajectory data by using the generated simulation trajectory data and the real trajectory data as the data source of trajectory data classification, thus effectively solving the problem of data sparsity and avoiding the negative effect of sparse trajectory data on trajectory data classification. Because sparse trajectory data also have corresponding trajectory user mapping, it is helpful to classify sparse trajectory data.
【技术实现步骤摘要】
一种基于生成对抗网络的轨迹数据分类方法
本专利技术属于机器学习中的深度学习领域,涉及一种基于机器学习的轨迹数据方法,尤其涉及一种基于对抗学习进行数据增强,从而提升轨迹数据分类效果的数据处理方法。
技术介绍
随着人类生活中智能手机、可穿戴智能设备的普及,越来越多的基于位置的社交网络(LBSNs)数据被挖掘。对这些数据按照用户进行分类是一个非常重要的研究方向,分类的结果对广告或地点用户的精准推荐,甚至对于追踪失踪人口都有巨大的用处。传统的机器学习方法使用SVM、LDA、LCSS等算法对数据进行分类。而当今社会是一个大数据的时代,在海量数据的前提下,传统机器学习算法对于计算机内存的消耗让很多计算机设备难以承受,而深度学习不仅可以轻松地处理海量的数据,并且还可以达到优于传统机器学习算法的效果。使用循环神经网络(RNN)或者其变体长短期记忆网络(LSTM)将轨迹按用户类别进行分类(如图1所示),达到的分类效果要好于传统的机器学习算法,具体处理过程如下:将进行预处理(包括删除过长数据和删除数据量较少的用户)后的轨迹数据,例如图1中的T11(用户1的第一条轨迹)、T21(用户1的第二条轨迹)、T12(用户2的第一条轨迹)、T22(用户2的第二条轨迹)……;使用Word2vec技术进行词向量的转换,将离散的轨迹点转化为连续空间中的向量(这些向量中包含了数据的上下文信息,也就代表了原始数据之间的关系),处理后的轨迹向量可以正确表示出原有轨迹数据中前一轨迹点和后一轨迹点之间的某种联系;再将向量化的数据输入到循环神经网络(RecurrentNeuralNetwork,RNN)中 ...
【技术保护点】
1.一种基于生成对抗网络的轨迹数据分类方法,其特征在于包括以下步骤:S1,将真实轨迹数据输入生成对抗网络,使生成对抗网络训练至生成器生成与真实轨迹数据同分布的仿真轨迹数据;S2,利用生成对抗网络的生成器生成若干组仿真轨迹数据;S3,对生成的若干组仿真轨迹数据与真实轨迹数据一起进行分类处理,得到轨迹用户映射。
【技术特征摘要】
1.一种基于生成对抗网络的轨迹数据分类方法,其特征在于包括以下步骤:S1,将真实轨迹数据输入生成对抗网络,使生成对抗网络训练至生成器生成与真实轨迹数据同分布的仿真轨迹数据;S2,利用生成对抗网络的生成器生成若干组仿真轨迹数据;S3,对生成的若干组仿真轨迹数据与真实轨迹数据一起进行分类处理,得到轨迹用户映射。2.根据权利要求1所述基于生成对抗网络的轨迹数据分类方法,其特征在于所述步骤S1包括以下分步骤:S11,将从高斯分布中采样的随机噪音作为输入数据输入到生成对抗网络的生成器,生成一组仿真轨迹数据;S12,生成器输出的仿真轨迹数据与真实轨迹数据一起输入到生成对抗网络的鉴别器中,鉴别器对仿真轨迹数据和真实数据进行鉴别,得到鉴别结果;并根据鉴别结果分别计算得到生成器损失函数值和鉴别器损失函数值;S13,判断得到的生成器损失函数值和鉴别器损失函数值是否趋于稳定,若趋于稳定,则进入步骤S2;若没有趋于稳定,则进入步骤S14;S14,将得到的生成器损失函数值和鉴别器损失函数值分别返回至生成器和鉴别器,并利用生成器损失函数值和鉴别器损失函数值分别对生成器和鉴别器的参数进行修正,之后返回步骤S11。3.根据权利要求2所述基于生成对抗网络的轨迹数据分类方法,其特征在于所述步骤S11包括以下分步骤:S111,将从高斯分布中采样的随机噪音作为输入数据输入到生成器的网络模型中,产生一组数据;S112,将步骤S111产生的一组数据压缩至-1到1之间;S113,将得到的压缩数据作为符合真实轨迹数据向量维度的随机化生成向量,同时将来自数据集的真实轨迹数据进行向量化,得到真实轨迹数据对应的向量;S114,分别计算每一条随机化生成向量与真实轨迹数据对应的向量之间的余弦夹角;S115,遍历得到的余弦夹角,找出与真实轨迹数据对应的向量夹角之差最小的随机生成向量,构成仿真向量;S116,将步骤S115得到的仿真向量还原成真实轨迹数据中相应的轨迹点,得到...
【专利技术属性】
技术研发人员:周帆,殷睿阳,钟婷,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。