一种基于深度强化学习的景点人流辅助引导系统和方法技术方案

技术编号:28462927 阅读:28 留言:0更新日期:2021-05-15 21:28
本发明专利技术涉及一种基于深度强化学习的景点人流辅助引导系统和方法。主要包括数据采集模块和数据处理模块,所述数据采集模块用于获取环境数据,所述环境数据为当前景点的人数信息以及与当前景点直接相邻的景点的人数信息,所述数据处理模块用于接收所述数据采集模块的环境数据,所述数据处理模块包括建模单元和决策单元,所述建模单元用于根据所述环境数据建立环境模型,所述决策单元根据所述环境模型获得最优引导策略。上述系统通过收集环境数据,并通过决策单元获得最优引导策略。该系统可实时采集相应的环境数据,并依据这些环境数据自适应调节引导策略。通过引导策略可辅助引导各个景点的人流朝不同景点疏散。有效缓解景点拥堵情况。堵情况。堵情况。

【技术实现步骤摘要】
一种基于深度强化学习的景点人流辅助引导系统和方法


[0001]本专利技术涉及景区管理领域,特别是涉及基于深度强化学习的景点人流辅助引导系统和方法。

技术介绍

[0002]传统景区能够对进入景区的人流数据进行统计,但对于景区内各个景点的人流数据并没有进行统计。这种传统景区存在以下不足:1、缺乏对游客进行引导的系统,使游客容易在某些景点聚集,造成拥堵情况的发生,且该景点拥堵后,游客无法获得有效的信息,不知该去往哪个景点比较合适。2、无法有效对人群密集景点进行早期预警与管理。

技术实现思路

[0003]基于此,提供一种基于深度强化学习的景点人流辅助引导系统。该系统可辅助引导各个景点的人流朝不同景点疏散。
[0004]一种基于深度强化学习的景区景点人流辅助引导系统,
[0005]包括数据采集模块和数据处理模块,
[0006]所述数据采集模块用于获取环境数据,所述环境数据为当前景点的人数信息以及与当前景点直接相邻的景点的人数信息,
[0007]所述数据处理模块用于接收所述数据采集模块的环境数据,所述数据处理本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的景区景点人流辅助引导系统,其特征在于,包括数据采集模块和数据处理模块,所述数据采集模块用于获取环境数据,所述环境数据为当前景点的人数信息以及与当前景点直接相邻的景点的人数信息,所述数据处理模块用于接收所述数据采集模块的环境数据,所述数据处理模块包括建模单元和决策单元,所述建模单元用于根据所述环境数据建立环境模型,所述决策单元根据所述环境模型获得最优引导策略。2.根据权利要求1所述的基于深度强化学习的景区景点人流辅助引导系统,其特征在于,所述建模单元用于根据所述环境数据建立环境模型,所述决策单元根据所述环境模型获得最优引导策略包括:通过人流预测单元预测获得m分钟后的当前景点的人数;将人流引导问题建模为一个MDP模型,并定义其中的状态,动作以及立即奖赏函数:状态,用s表示,设t时刻当前景点的人数为N
t
,人流预测单元得到m分钟后的人数为N
t+1
,与当前景点直接相邻的各个景点的人数为N
it
,与当前景点直接相邻的各个景点的预测人数为N
it+1
,其中i表示第i个相邻景点,则状态可以表示为:s
t
=(N
t
,N
t+1
,N
1t
,N
1t+1
,N
2t
,N
2t+1
,

,N
it
,N
it+1
);动作,用a表示,t时刻的动作为设置第i个相邻景点的引导灯,设置第i个相邻景点的引导灯用O
i
表示,其中,引导灯为绿色表示该景点畅通,引导灯为黄色表示该景点正常,引导灯为红色表示该景点拥堵,则动作a可以表示为:a=(O1,O2,O3…
O
i
);立即奖赏函数,用r表示,r=(100/N
s
)*x+0.01*(N
′‑
x),0≤x≤N
s
,r=100

(1000/N
s
)*(x

N
s
)+0.01*(N
′‑
x),x>N
s
,其中,N
s
为当前景点最优容纳人数,x为当前景点m分钟后的实际人数,N

为预测的当前景点m分钟后的人数;建立值函数回报模型,设R(s,a)表示在状态s下采用动作a的回报值,值函数Q(s,a)是关于R(s,a)的期望,则Q(s,a)=E[R(s,a)];利用DQN深度强化学习算法求解最优引导策略。3.根据权利要求2所述的基于深度强化学习的景区景点人流辅助引导系统,其特征在于,所述人流预测单元采用DQN的网络进行预测,人流预测单元的输入为当前景点的实时采集的人数信息,以及与当前景点直接相邻的各个景点的实时采集的人数信息,人流预测单元的输出为预测的m分钟后的当前景点的人数。4.根据权利要求2所述的基于深度强化学习的景区景点人流辅助引导系统,其特征在于,还包括应答模块,所述应答模块用于对接收到的请求信号进行应答,所述应答包括:发送推荐的相邻景点。5.根据权利要求4所述的基于深度强化学习的景区景点人流辅助引导系统,其特征在于,所述推荐的相邻景点的生成规则包括:引导灯为黄色和绿色的景点为可推荐景点,当前景点有n个相邻景点为可推荐景点时,各个相邻景点被推荐的概率为:|N
si

x
i
|/(|N
s1
...

【专利技术属性】
技术研发人员:陈建平黄泽天傅启明
申请(专利权)人:浙江贝迩熊科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1