【技术实现步骤摘要】
一种基于逆向强化学习的游客行为偏好建模方法
本专利技术涉及位置感知、机器学习
,尤其涉及一种基于逆向强化学习的游客行为偏好建模方法。
技术介绍
利用旅游推荐技术为用户提供个性化服务并提高推荐性能和游客满意度,是当前智慧旅游领域研究的热点之一。在旅游推荐中,理解游客的行为模式,学习游客偏好是非常重要的。当前的旅游推荐技术主要根据游客游览展品的评分、签到数据、访问的频次等数据作为游客对游览展品喜好程度的评判依据。但是,具体景区内部,如博物馆、主题公园等,通常无法获得游客针对游览点或展品的具体评分数据,因此不能对游客进行细粒度偏好学习,从而也不能获得针对特定景区内部的游览推荐。并且许多推荐算法需要大量的游客历史数据来训练,从而学习出游客偏好再进行推荐,然而展馆内部的游客数据较为稀缺、不完整,因此也无法根据有限的游客数据学习出精准的偏好。
技术实现思路
本专利技术的目的在于提供一种基于逆向强化学习的游客行为偏好建模方法,能根据有限的游客游览数据学习出精准的游客偏好。为实现上述目的,本专利技术提供了一 ...
【技术保护点】
1.一种基于逆向强化学习的游客行为偏好建模方法,其特征在于,包括:/n基于iBeacon与智能手机相结合,获取并保存游客的游览行为数据;/n根据所述游览行为数据进行马尔科夫决策过程建模并构建回报函数;/n获取并在所述回报函数中加入拍照次数和停留时间,并把所述游览数据转换为专家示例数据;/n利用最大似然逆向强化学习算法来对游客游览轨迹进行偏好的学习。/n
【技术特征摘要】
1.一种基于逆向强化学习的游客行为偏好建模方法,其特征在于,包括:
基于iBeacon与智能手机相结合,获取并保存游客的游览行为数据;
根据所述游览行为数据进行马尔科夫决策过程建模并构建回报函数;
获取并在所述回报函数中加入拍照次数和停留时间,并把所述游览数据转换为专家示例数据;
利用最大似然逆向强化学习算法来对游客游览轨迹进行偏好的学习。
2.如权利要求1所述的一种基于逆向强化学习的游客行为偏好建模方法,其特征在于,所述基于iBeacon与智能手机相结合,获取并保存游客的游览行为数据,包括:
获取并对室内展览馆内的iBeacon设备进行分组,同时将iBeacon协议数据中的Minor和Major结合对展品进行定位,同时智能手机中的应用程序接收到iBeacon设备广播信号,读取传感器数据并监听拍照广播,通过无线网络将采集的数据上传至系统服务器。
3.如权利要求2所述的一种基于逆向强化学习的游客行为偏好建模方法,其特征在于,所述基于iBeacon与智能手机相结合,获取并保存游客的游览行为数据,还包括:
根据接收拍照广播的次数和iBeacon的位置标识,所述系统服务器将统计出游客在目标展品的拍照次数,并通过文件存储采集到的游客游览行为数据。
4.如权利要求3所述的一种基于逆向强化学习的游客行为偏好建模方法,其特征在于,根据所述游览行为数据进行马尔科夫决策过程建模并构建回报函数,包括:
获取马尔科夫决策过程中的S、A、P、r和γ五个元素,构建马尔科夫决策过程模型,并结合设定的策略得到游客的交互序列,其中,S表示游客当前浏览展品的记录的状态空间,A表示在对应状态下,游客下一个将要浏览的展品的动...
【专利技术属性】
技术研发人员:常亮,宣闻,宾辰忠,陈源鹏,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。