基于循环神经网络和注意力机制的下一个地点预测方法技术

技术编号：22817817 阅读：44 留言：0更新日期：2019-12-14 13:24

本发明专利技术公开了基于循环神经网络和注意力机制的下一个地点预测方法，包括以下步骤：获取所有用户的历史签到数据并按时间先后形成签到序列，根据历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；根据向量I和向量L计算包含时间戳中用户签到时间和地点ID信息的向量C

Next location prediction method based on recurrent neural network and attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
基于循环神经网络和注意力机制的下一个地点预测方法
本专利技术涉及下一个地点预测方法
，具体来说，涉及基于循环神经网络和注意力机制的下一个地点预测方法。
技术介绍
近些年来，越来越多基于位置的社交应用鼓励用户通过签到共享活动。基于此，大量的用户轨迹数据得以积累，这些数据包含空间和时间信息，即用户去了何地，在何时进行了签到。但是，用户对位置的共享具有很强的随机性，用户自身是否乐于签到、时间是否允许签到、情绪变化等，都能在一定程度上影响用户的签到情况。这使得签到数据十分稀疏，有可能用户在某日去了二十余个地点，但只在五个地方进行了签到。对于一个特定的用户来说，这些离散的签到数据可以按照时间整合为一个序列，该序列能够反映出用户的一个历史访问情况。对这些序列数据进行分析后，研究人员发现用户行为具有随机和多变的特点。研究人员还发现，用户行为在社会和地理信息的影响下，仍存在一定的规律性。挖掘用户轨迹所反映出来的行为习惯与规律，以此作为基础的下一个地点预测研究有着广泛的应用，如城市计算、疾病防控、交通流预测、个性化推荐、摘要总结、语义角色标注。下一个地点预测广阔的应用前景，吸引着越来越多的研究人员。在过去的十年间，对下一个地点进行预测的方法层出不穷。常用的包括马尔可夫模型、矩阵分解、循环神经网络、贝叶斯模型。基于上述方法，研究人员在进行预测时考虑了时间和空间的规律性。但目前仍存在如下问题：1、用户总是更愿意在他们最感兴趣的位置签到，这使得签到数据十分稀疏，而且用户的行为习惯会随着时间的变化而发生改变，时间...

【技术保护点】
1.基于循环神经网络和注意力机制的下一个地点预测方法，通过面向用户历史轨迹数据，采用循环神经网络以及自注意力机制对用户行为规律进行挖掘，对下一个地点进行预测的方法，其特征在于，包括以下步骤：/n获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；/n根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C

【技术特征摘要】
1.基于循环神经网络和注意力机制的下一个地点预测方法，通过面向用户历史轨迹数据，采用循环神经网络以及自注意力机制对用户行为规律进行挖掘，对下一个地点进行预测的方法，其特征在于，包括以下步骤：
获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；
根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C0；
根据所述向量C0计算体现所述签到序列中各个所述地点ID位置之间的关系向量X；
根据所述向量X和所述向量I计算包含所述用户ID信息和各个所述地点ID位置之间的关系向量C1；
根据所述向量C1按照预先设定的法则分别计算Scorepos和Scoreatt；
根据所述Scorepos和所述Scoreatt的计算结果生成预测列表。

2.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T中还包括以下步骤：
对所述签到数据中的所述用户ID进行映射，映射后的向量I可以唯一标识该用户；
对所述签到数据中的所述地点ID进行映射，映射后的向量L反应用户去过的地点；
对所述签到数据中的所述时间戳进行映射，映射后的向量T反应用户在该地点进行签到的时间；
其中，所述时间戳(t1,t2，…tn)，所述地点ID(l1,l2，…ln)和所述用户ID可以分别嵌入实值向量T，L，I中，对于给定的用户，所述向量I，L，T包括该用户一端时间内的行为信息，并在一定程度上能够反映出该用户的行为规律。

3.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C0中还包括以下步骤：
将所述向量L和所述向量T进行连接，得到包含用户所到地点和所到地点时间信息的向量C0，且所述向量C0包含位置信息和用户访问时间信息；
通过GRU对所述向量C0进行处理，获取给定用户所述签到序列中各个所述地点ID位置之间的关系。

4.根据权利要求1所述的基于循环神...

【专利技术属性】
技术研发人员：曾骏，何欣，唐浩然，文俊浩，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人