一种基于强化学习的个性化旅游线路推荐方法技术

技术编号:33200124 阅读:55 留言:0更新日期:2022-04-24 00:35
本发明专利技术公开了一种于强化学习的个性化旅游线路推荐方法,首先获取不同景点之间的移动交通时间和每个景点的平均访问时间,根据用户历史访问旅游线路建立景点

【技术实现步骤摘要】
一种基于强化学习的个性化旅游线路推荐方法


[0001]本专利技术涉及旅游线路推荐
,主要涉及一种基于强化学习的个性化旅游线路推荐方法。

技术介绍

[0002]随着高精度定位技术的发展和各类移动设备(智能手机、运动手环和车载定位装置等)的成熟和广泛应用,极大的改变了人们生活的方方面面。作为连接网络空间和物理世界的互联网新平台,越来越多的社交媒体网站如雨后春笋般涌现出来。用户在基于位置的社交网络中主动或被动地留下地理位置信息,由此产生了大规模的时空轨迹数据(位置签到数据、旅行轨迹数据等)。海量的时空轨迹数据记录了用户在现实世界的移动活动,同时蕴含着丰富的个性化兴趣偏好信息。如何通过地理位置数据挖掘用户对景点的兴趣偏好,为用户提供个性化的旅游线路推荐服务已成为推荐领域亟待解决的重要问题。
[0003]尽管传统的旅游推荐系统可以为游客提供标准的旅游套餐,但这些套餐通常只包含热门景点,而无法满足游客的个性化需求。现有的主流方法试图将旅游路线推荐问题转化成定向问题的变体形式,并同时考虑用户个性化偏好和时空约束,然后利用优化算法推荐群体路线。具体来说,用户个性化偏好通过类别信息计算的,即用户在某个景点类别上停留的时间越长或者访问次数越多,那么用户对该景点类别越感兴趣,这样会造成景点类别的冷启动问题。
[0004]目前大部分个性化的行程推荐方法存在以下问题:(1)用户旅行体验是指用户对整个旅行过程的满意度。然而,以往的个性化行程推荐工作大多认为旅游体验只涉及景点的访问,在设计合适的行程时只考虑POI的受欢迎程度和用户对景点的兴趣偏好。(2)访问模式具有非对称性,比如“餐厅
”→“
咖啡馆”的转换概率远远大于“咖啡馆
”→“
餐厅”的转换概率。(3)当前访问的景点不仅受到上一次访问景点的影响,还受到旅游线路中其他景点的影响。

技术实现思路

[0005]专利技术目的:针对上述
技术介绍
中存在的问题,本专利技术提供了一种基于强化学习的个性化旅游线路推荐方法。首先获取不同景点之间的交通时间,每个景点的平均访问时间;然后,根据用户历史访问旅游线路建立用户偏好模型和景点

景点转移概率模型;接着,根据用户偏好模型、景点

景点转移概率模型和景点热度模型,构建景点效用函数模型;最后,根据景点效用函数模型和个性化旅游路线约束,通过一种强化学习算法,得到最匹配的旅游路线作为最终向用户推荐的旅游路线。
[0006]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0007]一种基于强化学习的个性化旅游线路推荐方法,包括以下步骤:
[0008]步骤S1、获取不同景点之间的移动交通时间和每个景点的平均访问时间;
[0009]步骤S2、根据用户历史访问旅游线路建立景点

景点转移概率模型和用户偏好模
型;
[0010]步骤S3、构建景点热度模型,并基于所述用户偏好模型、景点

景点转移概率模型和景点热度模型,构建景点效用函数模型;
[0011]步骤S4、基于获取的景点效用函数模型和个性化旅游路线约束,设计强化学习算法,获取匹配度最高的旅游路线,作为最终向用户推荐的旅游路线。
[0012]进一步地,所述步骤S1中获取不同景点的交通通行时间和景点的平均访问时间具体步骤包括:
[0013]步骤S1.1、获取不同景点之间的移动交通时间;
[0014]根据两个景点间的距离长度,将景点间的通行方式划分为步行、骑行与车行;其中当景点之间距离小于2km时,则默认计算步行时间;当景点之间距离在2km

5km之间时,则默认计算骑行时间,当景点之间距离大于5km时,则默认计算车行时间;基于第三方地图API可以获取采用不同骑行方式时两个景点之间的移动交通时间;将景点p
i
和景点p
j
之间的移动交通时间记为T(p
i
,p
j
);
[0015]步骤S1.2、获取各景点的平均访问时间;
[0016]根据用户历史旅游路线和群体历史旅游路线,统计每个景点的平均访问时间;景点访问时间为到达景点和离开景点之间的时间差,将景点p
i
的平均访问时间记做D(p
i
)。
[0017]进一步地,步骤S2中建立景点

景点转移概率模型和用户偏好模型的具体步骤包括:
[0018]步骤S2.1、对景点和用户数据进行编号,得到景点p
i
和用户u
i
的one

hot热独编码,经过嵌入层embedding layer,获取景点的初始表示向量p
i
和用户的初始表征向量u
i

[0019]步骤S2.2、通过图注意力网络,学习景点的输出表示向量;
[0020]用户访问景点p
i
后下一步访问的景点p
j
,学习景点p
i
在神经网络第l层的输出表示向量计算方式如下:
[0021][0022]其中表示景点p
i
在第l层的输出表示向量,初始化为景点p
i
的初始表示向量p
i
,α
ij
代表其他景点的权重,计算方法如下:
[0023][0024][0025]其中W
e
表示注意力网络的权值参数,通过使用归一化指数函数计算其他景点的权重;LeakyReLU()为激活函数,给所有负值赋予一个非零斜率,计算过程如下:
[0026][0027]其中,a为(1,∞)区间内的固定参数。
[0028]步骤S2.3、通过图注意力网络,学习景点的输入表示向量;
[0029]根据景点p
i
上一步访问的景点p
j
,学习景点p
i
在第l层的输入表示向量计算方式如下:
[0030][0031]表示景点p
i
在第l层的输入表示向量,初始化为景点p
i
的初始表示向量p
i
,b
ij
为其他景点的权重,计算方式如下:
[0032][0033][0034]W
b
表示注意力网络的权值参数,使用归一化指数函数计算其他景点的权重;
[0035]步骤S2.4、根据景点p
i
在第L层的输出表示向量和景点p
j
在L层的输入表示向量,计算p
i

p
j
的转移概率模型如下:
[0036][0037]其中,为景点p
i
在第L层的输出表示向量,为景点p
j
在第L层的输入表示向量,为可学习的参数;
[0038]步骤S2.5、根据景点p
i
在第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的个性化旅游线路推荐方法,其特征在于,包括以下步骤:步骤S1、获取不同景点之间的移动交通时间和每个景点的平均访问时间;步骤S2、根据用户历史访问旅游线路建立景点

景点转移概率模型和用户偏好模型;步骤S3、构建景点热度模型,并基于所述用户偏好模型、景点

景点转移概率模型和景点热度模型,构建景点效用函数模型;步骤S4、基于获取的景点效用函数模型和个性化旅游路线约束,设计强化学习算法,获取匹配度最高的旅游路线,作为最终向用户推荐的旅游路线。2.根据权利要求1所述的一种基于强化学习的个性化旅游线路推荐方法,其特征在于,所述步骤S1中获取不同景点的交通通行时间和景点的平均访问时间具体步骤包括:步骤S1.1、获取不同景点之间的移动交通时间;根据两个景点间的距离长度,将景点间的通行方式划分为步行、骑行与车行;其中当景点之间距离小于2km时,则默认计算步行时间;当景点之间距离在2km

5km之间时,则默认计算骑行时间,当景点之间距离大于5km时,则默认计算车行时间;基于第三方地图API可以获取采用不同骑行方式时两个景点之间的移动交通时间;将景点p
i
和景点p
j
之间的移动交通时间记为T(p
i
,p
j
);步骤S1.2、获取各景点的平均访问时间;根据用户历史旅游路线和群体历史旅游路线,统计每个景点的平均访问时间;景点访问时间为到达景点和离开景点之间的时间差,将景点p
i
的平均访问时间记做D(p
i
)。3.根据权利要求2所述的一种基于强化学习的个性化旅游线路推荐方法,其特征在于,步骤S2中建立景点

景点转移概率模型和用户偏好模型的具体步骤包括:步骤S2.1、对景点和用户数据进行编号,得到景点p
i
和用户u
i
的one

hot热独编码,经过嵌入层embedding layer,获取景点的初始表示向量p
i
和用户的初始表征向量u
i
;步骤S2.2、通过图注意力网络,学习景点的输出表示向量;用户访问景点p
i
后下一步访问的景点p
j
,学习景点p
i
的在神经网络第l层的输出表示向量计算方式如下:其中表示景点p
i
在第l层的输出表示向量,初始化为景点p
i
的初始表示向量p
i
,α
ij
代表其他景点的权重,计算方法如下:代表其他景点的权重,计算方法如下:其中W
e
表示注意力网络的权值参数,通过使用归一化指数函数计算其他景点的权重;LeakyReLU()为激活函数,给所有负值赋予一个非零斜率,计算过程如下:
其中,a为(1,∞)区间内的固定参数。步骤S2.3、通过图注意力网络,学习景点的输入表示向量;根据景点p
i
上一步访问的景点p
j
,学习景点p
i
在第l层的输入表示向量计算方式如下:下:表示景点p
i
在第l层的输入表示向量,初始化为景点p
i
的初始表示向量p
i
,b
ij
为其他景点的权重,计算方式如下:点的权重,计算方式如下:W
b
表示注意力网络的权值参数,使用归一化指数函数计算其他景点的权重;步骤S2.4、根据景点p
i
在第L层的输出表示向量和景点p
j
在L层的输入表示向量,计算p
i

p
j
的转移概率模型如下:其中,为景点p
i
在第L层的输出表示向量,为景点p
j
在第L层的输入表示向量,为可学习的参数;步骤S2.5、根据景点p
i
在第l层的输出表示向量和输入表示向量,计算景点p
i
在第l层的表示向量如下:其中,是景点p
i
在第l层的表示向量,||为拼接操作;步骤S2.6、根据景点在第l层的表示向量,计算用户在第l层的表示向量如下:其中,和分别为用户u
...

【专利技术属性】
技术研发人员:曹杰陈蕾王有权丁达申冬琴罗婕
申请(专利权)人:云境商务智能研究院南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1