一种基于多活跃区域感知网络的下一个兴趣点推荐方法技术

技术编号:38154052 阅读:11 留言:0更新日期:2023-07-13 09:20
本发明专利技术公开了一种基于多活跃区域感知网络的下一个兴趣点推荐方法。该方法充分利用用户行为轨迹在空间上的聚集性,通过分析用户的历史活动轨迹对用户的活跃区域中心进行筛选,并根据距离进行划分、聚合,实现活跃区域内长期稳定的用户偏好特征的获取。同时该方法基于邻居地区的负样本采样方法,通过用户的活动区域对兴趣点进行筛选,充分利用地理位置特性,获取信息更加丰富的样本信息。本发明专利技术基于用户的历史签到数据以及其他多模态信息,通过深度学习方法构建网络模型,提取用户偏好特征来预测当前用户下一个最有可能访问的地点,具有准确度高、可扩展性强等特点,可以及时掌握用户行为走向,为用户行为轨迹预测人员提供指导。为用户行为轨迹预测人员提供指导。为用户行为轨迹预测人员提供指导。

【技术实现步骤摘要】
一种基于多活跃区域感知网络的下一个兴趣点推荐方法


[0001]本专利技术涉及特征提取和模型构建领域,尤其涉及一种基于多活跃区域感知网络的下一个兴趣点推荐方法。

技术介绍

[0002]随着基于位置的社交网络的不断发展,大量的地理标记数据集如Foursquare、Gowalla和Yelp等提供了大量用户的历史签到信息以及其他多模态信息,这些海量的数据为兴趣点(Point

of

Interest,POI)推荐提供了新的机会,逐渐成为推荐系统领域的一个重要主题。作为智慧城市应用的一个重要组成部分,兴趣点推荐可以利用用户的历史签到信息和其他多模态信息(如签到时间、兴趣点类别、地理位置、社会声誉等),来学习用户的行为特征、行动规律,从而为用户推荐感兴趣的地点。
[0003]以往的研究针对兴趣点推荐任务的特性,对兴趣点推荐的各方面影响因素进行了研究,并提出了许多模型。在早期的研究中,研究人员着重采用了矩阵分解和马尔科夫链的方法学习用户的行为数据。之后,基于递归神经网络的模型逐渐被人们广泛采用。虽然现在的兴趣点预测方法卓有成效,但用户轨迹的易变性未得到很好的解决,用户行为轨迹在空间上呈现的聚集性也未能得到充分利用。同时,数据稀疏性问题也日益严重,面对百万数量的候选对象,用户往往只会访问极少数的地点,数据稀疏性强。
[0004]因此,如何针对复杂多样的用户行为轨迹设计合理的兴趣点推荐方法,是目前亟待解决的技术问题。

技术实现思路

[0005]为了克服上述现有技术的不足,本专利技术提供一种基于多活跃区域感知网络的下一个兴趣点推荐方法,可有效解决上述问题。
[0006]本专利技术具体采用的技术方案如下:
[0007]一种基于多活跃区域感知网络的下一个兴趣点推荐方法,其包括以下步骤:
[0008]S1、针对数据集中的用户历史行为轨迹,分别提取用户ID、地点ID、用户访问时间和经纬度GPS信息;根据用户历史行为轨迹以及地理位置信息,提取地区转移轨迹,并分别生成每个用户的历史行为轨迹子串和地区转移轨迹子串,构建形成轨迹数据集;
[0009]S2、针对S1中每个用户的历史行为轨迹,根据用户的活跃程度确定活跃中心,并根据用户历史行为轨迹在空间上的聚集性行为划定当前用户的多个局部活跃区域,在保持用户历史行为轨迹不变的基础上添加中心地点指向,建立用户活跃区域有向图;同时针对S1中每个用户的地区转移轨迹,根据用户的活跃程度确定活跃中心,并根据地区转移轨迹直接构建地区转移轨迹有向图;
[0010]S3、针对S1中每个用户的历史行为轨迹子串和地区转移轨迹子串,以及S2中构建的用户活跃区域有向图和地区转移轨迹有向图,构建模型训练集;
[0011]S4、利用S3中构建的训练集训练多活跃区域感知网络(Multiple Active Region

Aware Network,MARAN),从而得到下一个兴趣点推荐模型,用于以待预测时间段之前的历史行为轨迹和地区转移轨迹为输入,对下一时刻用户可能访问的兴趣点进行预测;
[0012]S5、针对目标用户,将其历史行为轨迹和地区转移轨迹输入下一个兴趣点推荐模型中,对下一时刻目标可能访问的兴趣点进行预测。
[0013]作为优选,所述S1具体包括以下子步骤:
[0014]S11、获取数据集,其中包含用户集合以及兴趣点POI集合每一个兴趣点POI都有一个关联的地理位置坐标(lat,lon),lat,lon分别表示其纬度和经度;一次签到行为表示为c=(u,l,t),代表用户u在t时刻访问地点l;用户历史行为轨迹是由用户按签到时间进行排序一系列的签到行为序列,通过S(u)=[c1,c2,...,c
n
]表示,代表用户的历史签到行为序列,n为序列长度;将用户u的历史行为轨迹S(u)分割为多个长度相等的子串S(u)=[S1,S2,...,S
k
],k∈[1,|S(u)|/m],其中|S
k
|=m为子串S
k
的长度,若出现子串长度未满m则通过在子串末尾补0进行补齐;
[0015]S12、使用Geohash

5方法,对兴趣点POI的经纬度坐标进行位置编码以表示空间位置信息,从而得到所有兴趣点POI的空间位置信息集合G={g1,g2,...,g
|G|
},其中每一个兴趣点POI只有一个与之对应的Geohash

5位置编码;根据S11中的历史行为轨迹S(u),按照轨迹中的地点与Geohash

5位置编码之间的关系,得到对应的地区转移轨迹S
g
(u)=[g1,g2,...,g
n
]及其子串其中为子串长度,子串长度未满m则通过末尾补0进行补齐;
[0016]S13、所有用户的行为轨迹子串和地区转移轨迹子串构建形成轨迹数据集。
[0017]作为优选,所述S2具体包括以下子步骤:
[0018]S21、根据用户历史行为轨迹S(u),获取用户u在每个地点l的访问频率信息l
freq
,并筛选出访问频率超过设定频率的所有地点形成活跃区域中心集合筛选过程表示为:
[0019][0020]其中|S(u)|表示当前用户历史行为轨迹长度;表示当前用户访问的POI集合;α为预设的超参数,若根据初始设定的α计算得到的则取α为α/2并重新计算;
[0021]S22、对S21中得到的活跃区域中心集合将集合中的每个地点作为一个活跃区域的中心地点,计算集合中每个活跃区域的中心地点与其他非中心地点之间的Haversine距离d
pq
=Haversine(GPS
p
,GPS
q
),根据距离d
pq
将各非活跃区域中心地点划分到距离最近的活跃区域,从而得到用户活跃区域集合
[0022]S23、根据用户地区转移轨迹S
g
(u),获取用户u在每个地区g的访问频率信息g
freq
,并筛选出访问频率高于设定频率的地区形成活跃地区集合G
c
(u),筛选过程表示为:
[0023]G
c
(u)={g|g
freq
≥β|s
g
(u)|,g∈G(u)}
[0024]其中|S
g
(u)|表示当前用户地区转移轨迹长度;G(u)表示当前用户访问的地区集
合;β为预设的超参数,若根据初始设定的β计算得到的|G
c
(u)|=0则取β为β/2并重新计算;
[0025]S24、根据S21和S22中得到的活跃区域中心集合和用户活跃区域集合C(u),在保持用户历史行为轨迹不变的基础上,将每个活跃区域中的非中心地点指向中心地点,建立用户活跃区域有向图其中V为节点集合,E为边集合;另外,针对地理位置关系,根据地区本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多活跃区域感知网络的下一个兴趣点推荐方法,其特征在于,包括以下步骤:S1、针对数据集中的用户历史行为轨迹,分别提取用户ID、地点ID、用户访问时间和经纬度GPS信息;根据用户历史行为轨迹以及地理位置信息,提取地区转移轨迹,并分别生成每个用户的历史行为轨迹子串和地区转移轨迹子串,构建形成轨迹数据集;S2、针对S1中每个用户的历史行为轨迹,根据用户的活跃程度确定活跃中心,并根据用户历史行为轨迹在空间上的聚集性行为划定当前用户的多个局部活跃区域,在保持用户历史行为轨迹不变的基础上添加中心地点指向,建立用户活跃区域有向图;同时针对S1中每个用户的地区转移轨迹,根据用户的活跃程度确定活跃中心,并根据地区转移轨迹直接构建地区转移轨迹有向图;S3、针对S1中每个用户的历史行为轨迹子串和地区转移轨迹子串,以及S2中构建的用户活跃区域有向图和地区转移轨迹有向图,构建模型训练集;S4、利用S3中构建的训练集训练多活跃区域感知网络(Multiple Active Region

Aware Network,MARAN),从而得到下一个兴趣点推荐模型,用于以待预测时间段之前的历史行为轨迹和地区转移轨迹为输入,对下一时刻用户可能访问的兴趣点进行预测;S5、针对目标用户,将其历史行为轨迹和地区转移轨迹输入下一个兴趣点推荐模型中,对下一时刻目标可能访问的兴趣点进行预测。2.如权利要求1所述的基于多活跃区域感知网络的下一个兴趣点推荐方法,其特征在于,所述S1具体包括以下子步骤:S11、获取数据集,其中包含用户集合以及兴趣点POI集合每一个兴趣点POI都有一个关联的地理位置坐标(Lat,lon),lat,lon分别表示其纬度和经度;一次签到行为表示为c=(u,l,t),代表用户u在t时刻访问地点l;用户历史行为轨迹是由用户按签到时间进行排序一系列的签到行为序列,通过S(u)=[c1,c2,

,c
n
]表示,代表用户的历史签到行为序列,n为序列长度;将用户u的历史行为轨迹S(u)分割为多个长度相等的子串S(u)=[S1,S2,

,S
k
],k∈[1,|S(u)|/m],其中|S
k
|=m为子串S
k
的长度,若出现子串长度未满m则通过在子串末尾补0进行补齐;S12、使用Geohash

5方法,对兴趣点POI的经纬度坐标进行位置编码以表示空间位置信息,从而得到所有兴趣点POI的空间位置信息集合G={g1,g2,

,g
|G|
},其中每一个兴趣点POI只有一个与之对应的Geohash

5位置编码;根据S11中的历史行为轨迹S(u),按照轨迹中的地点与Geohash

5位置编码之间的关系,得到对应的地区转移轨迹S
g
(u)=[g1,g2,

,g
n
]及其子串其中为子串长度,子串长度未满m则通过末尾补0进行补齐;S13、所有用户的行为轨迹子串和地区转移轨迹子串构建形成轨迹数据集。3.如权利要求1所述的基于多活跃区域感知网络的下一个兴趣点推荐方法,其特征在于,所述S2具体包括以下子步骤:S21、根据用户历史行为轨迹S(u),获取用户u在每个地点l的访问频率信息l
freq
,并筛选出访问频率超过设定频率的所有地点形成活跃区域中心集合筛选过程表示为:
其中|S(u)|表示当前用户历史行为轨迹长度表示当前用户访问的POI集合;α为预设的超参数,若根据初始设定的α计算得到的则取α为α/2并重新计算;S22、对S21中得到的活跃区域中心集合将集合中的每个地点作为一个活跃区域的中心地点,计算集合中每个活跃区域的中心地点与其他非中心地点之间的Haversine距离d
pq
=Haversine(GPS
p
,GPS
q
),根据距离d
pq
将各非活跃区域中心地点划分到距离最近的活跃区域,从而得到用户活跃区域集合S23、根据用户地区转移轨迹S
g
(u),获取用户u在每个地区g的访问频率信息g
freq
,并筛选出访问频率高于设定频率的地区形成活跃地区集合G
c
(u),筛选过程表示为:G
c
(u)={g|g
freq
≥β|S
g
(u)|,g∈G(u)}其中|S
g
(u)|表示当前用户地区转移轨迹长度;G(u)表示当前用户访问的地区集合;β为预设的超参数,若根据初始设定的β计算得到的|G
c
(u)|=0则取β为β/2并重新计算;S24、根据S21和S22中得到的活跃区域中心集合和用户活跃区域集合C(u),在保持用户历史行为轨迹不变的基础上,将每个活跃区域中的非中心地点指向中心地点,建立用户活跃区域有向图其中V为节点集合,E为边集合;另外,针对地理位置关系,根据地区转移轨迹S
g
(u)直接构建地区转移轨迹有向图4.如权利要求1所述的基于多活跃区域感知网络的下一个兴趣点推荐方法,其特征在于,所述S3具体包括以下子步骤:S31、对于每一个用户,将S11中生成的用户历史行为轨迹S(u)按照预设的比例分割形成模型训练所需的训练集和测试集;S32、将训练集和测试集中的样本数据,从轨迹数据集中获取S11和S12步骤中生成...

【专利技术属性】
技术研发人员:孙笑笑黄博祎蔡政俞东进
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1