当前位置: 首页 > 专利查询>江南大学专利>正文

一种限制性骑行路径规划装置及方法制造方法及图纸

技术编号:21768567 阅读:31 留言:0更新日期:2019-08-03 20:45
本发明专利技术公开了一种限制性骑行路径规划装置及方法,涉及数据分析领域,包括主机电路和从机电路,主机电路和从机电路通过无线通信连接;主机电路包括主机控制器、定位接收器、记录设备,主机控制器分别与定位接收器和记录设备连接;从机电路包括从机控制器、交互输入设备、交互显示设备,从机控制器分别与交互输入设备和交互显示设备连接;定位接收器用于定位帧数据中的经度数据和纬度数据,并对各个路径点进行标记;记录设备用于记录和存储位置数据;交互输入设备用于输入骑行目的地;交互显示设备用于显示用户的实时位置和骑行路径。根据用户的实际骑行需求选择出最适合用户的路径,适用场景多。

A Restrictive Biking Path Planning Device and Method

【技术实现步骤摘要】
一种限制性骑行路径规划装置及方法
本专利技术涉及数据分析领域,尤其是一种限制性骑行路径规划装置及方法。
技术介绍
随着共享单车的兴起,骑行运动方式渐渐推广,骑行市场被逐步开发出来。作为全球八大无线产业之一,GPS为代表的导航定位服务占领了广大市场,GPS因为全天、高精、高效等优势及其导航追踪、精准授时等各方面的实用功能,已经逐步应用到各个领域。现有的导航设备主要是根据行驶时间和出行方式来推荐路径,当用户确定出发地和目的地后,系统会根据出行方式生成路径和相应的时间。然而,面向骑行的导航设备比较少见,主要原因包括:投入成本巨大而盈利有限,单车上的导航设备使用场景单一,通常只涉及短途通勤场景,根据起点和终点规划最短路径。
技术实现思路
本专利技术针对上述问题及技术需求,提出了一种限制性骑行路径规划装置及方法。本专利技术的技术方案如下:第一方面,一种限制性骑行路径规划装置,包括:主机电路和从机电路,所述主机电路和所述从机电路通过无线通信连接;所述主机电路包括主机控制器、定位接收器、记录设备,所述主机控制器分别与所述定位接收器和所述记录设备连接;所述从机电路包括从机控制器、交互输入设备、交互显示设备,所述从机控制器分别与所述交互输入设备和所述交互显示设备连接;所述定位接收器用于定位帧数据中的经度数据和纬度数据,并对各个路径点进行标记;所述记录设备用于记录和存储位置数据;所述交互输入设备用于输入骑行目的地;所述交互显示设备用于显示用户的实时位置和骑行路径。其进一步的技术方案为:所述主机控制器和所述从机控制器采用STM32F103VET6单片机,所述定位接收器是UBLOX-NEO-6M模组和STM32F103VET6上自带的AT24C02EEPROM模块,其中,UBLOX-NEO-6M模组作为GPS信号分析处理模组,AT24C02存储GPS配置信息;所述记录设备采用MicroSD卡;所述交互输入设备采用按键模块;所述交互显示设备采用带ILI9341控制器的TFL液晶屏。其进一步的技术方案为:所述主机电路还包括第一无线通信模块,所述第一无线通信模块与所述主机控制器连接,所述从机电路还包括第二无线通信模块,所述第二无线通信模块与所述从机控制器连接;所述第一无线通信模块和所述第二无线通信模块用于实现所述主机电路和所述从机电路之间的无线通信。其进一步的技术方案为:所述第一无线通信模块和所述第二无线通信模块采用STM32F103VET6单片机上自带的ESP8266WiFi模块。第二方面,一种限制性骑行路径规划方法,应用于第一方面所述的限制性骑行路径规划装置中,所述方法包括:确定预定区域内的各个路径点,所述路径点为至少两条道路的交汇点;采集各个路径点的经纬度数据,记录各个路径点的海拔高度,对每个路径点预设风景评分,将每个路径点的经纬度数据、海拔高度、风景评分对应存储;接收用户选择的起点和终点,对于每个行驶路段,获取同时间段内GPS数据中其他骑行者的所有骑行路径,确定出起点与终点之间的所有待选路径集合,所述待选路径集合包括有向路段集、每条待选路径的最大海拔差集和每条待选路径的综合风景评分集;接收用户选择的骑行模式,所述骑行模式包括最短距离模式、风景最优模式、锻炼身体模式;根据用户选择的骑行模式,通过约束深度强化学习算法确定出对骑行模式对应的目标路径。其进一步的技术方案为:所述骑行模式为最短距离模式,所述通过约束深度强化学习算法确定出对骑行模式对应的目标路径,包括:待选路径集合W中包括所有路径点组成的路径点集E和有向路径集A,用户的起点位置ei为路径点集E中的第i个路径点,将用户的起点位置ei的状态特征表示为s(ei)=[xi,yi,xD,yD],xi表示起点的经度,yi表示起点的纬度,xD表示终点的经度,yD表示终点的纬度;起点位置ei到终点的骑行时间用Q(s(ei))表示,将起点位置ei的状态特征s(ei)输入BP神经网络得到起点到终点的骑行时间Q(s(ei));用户在待选路径集合G中所在路径点ei+n∈E,ei+n表示在起点位置ei后的第n个路径点,与起点位置ei相连接的所有路段ai,j组成起点位置ei的有向路径集A(ei);奖励函数r(ei,ai,i+1)表示用户在起点位置ei选择路段ai,i+1的骑行时间Q(s(ei));根据骑行经验执行贪婪策略π和环境交互得到由所在路径点、选择的相邻路段和骑行时间组成的求解:hi:k=ei,ai,i+1,r(ei,ai,i+1),ei+1,ai+1,i+2,...,ek,ek表示终点之前所经过的最后一个路口,即路径点集E中的第k个路径点;当完成一次求解,Q值发生更新,将求解中用户在起点位置ei以及之后经过的每个路径点表示为[s(ei),ai,i+1,r(ei,ai,i+1),s(ei+1)]存储于求解记忆P中;当每次完成成功求解时,计算成功求解中每个起点位置ei到终点位置的累积折减收益G(hi:k);定义节点记忆N={[s(ei),q(ei)|ei∈E,q(ei)=minG(hi:k)]},二元组s(ei),q(ei)存储起点位置ei的状态特征和起点到终点的最短骑行时间;采用深度Q-learning算法,神经网路的训练通过最小化起点位置ei到终点的最短骑行时间q(ei)和起点位置ei到终点的骑行时间估计值Q(s(ei))误差平方和,即其中θ为神经网络权重系数;采用ε贪婪策略,以ε概率选择当前最佳策略,1-ε概率随机选择策略,基于深度Q-learning算法,结合待选路径集合W,选择对应最短距离模式的路径,具体步骤包括:输入W=(E,A);初始化节点记忆N,循环执行初始化Q值及神经网络权重系数θ,嵌套循环1至k,在起点位置ei用户满足交通规则时,采用ε贪婪策略选择和起点位置相连的路段ai,i+1;将选择记录[s(ei),ai,i+1,r(ei,ai,i+1)]加入求解,并将记录[s(ei),ai,i+1,r(ei,ai,i+1),s(ei+1)]存储于求解记忆P,直到最后一个路径点ek和终点eD重合结束循环;计算成功从起点到终点的路径中每个起点位置ei到终点的累积折减收益G(hi:k),并更新节点记忆N;使用梯度下降更新θ,以最小化[(q(ei)-Q(s(ei),θ))]2,输出贪婪策略ai,i+1=π(ei),得到所选择的一个路段,到达终点后,所有选择的路段组成的路径即与最短距离模式对应的路径。其进一步的技术方案为:所述骑行模式为风景最优模式,所述通过约束深度强化学习算法确定出对骑行模式对应的目标路径,包括:根据骑行经验设定风景评分初始值g0,待选路径集合W中包括所有路径点组成的路径点集E、有向路径集A、每条待选路径的综合风景评分集g,用户的起点位置ei为路径点集E中的第i个路径点,将用户的起点位置ei的状态特征表示为s(ei)=[xi,yi,xD,yD],xi表示起点的经度,yi表示起点的纬度,xD表示终点的经度,yD表示终点的纬度;起点位置ei到终点的骑行时间用Q(s(ei))表示,将起点位置ei的状态特征s(ei)输入BP神经网络得到起点到终点的骑行时间Q(s(ei));用户在待选路径集合G中所在路径点ei+n∈E,ei+n表示在起点位置ei后的第n个路径点,与起点位置ei相连接的本文档来自技高网...

【技术保护点】
1.一种限制性骑行路径规划装置,其特征在于,包括:主机电路和从机电路,所述主机电路和所述从机电路通过无线通信连接;所述主机电路包括主机控制器、定位接收器、记录设备,所述主机控制器分别与所述定位接收器和所述记录设备连接;所述从机电路包括从机控制器、交互输入设备、交互显示设备,所述从机控制器分别与所述交互输入设备和所述交互显示设备连接;所述定位接收器用于定位帧数据中的经度数据和纬度数据,并对各个路径点进行标记;所述记录设备用于记录和存储位置数据;所述交互输入设备用于输入骑行目的地;所述交互显示设备用于显示用户的实时位置和骑行路径。

【技术特征摘要】
1.一种限制性骑行路径规划装置,其特征在于,包括:主机电路和从机电路,所述主机电路和所述从机电路通过无线通信连接;所述主机电路包括主机控制器、定位接收器、记录设备,所述主机控制器分别与所述定位接收器和所述记录设备连接;所述从机电路包括从机控制器、交互输入设备、交互显示设备,所述从机控制器分别与所述交互输入设备和所述交互显示设备连接;所述定位接收器用于定位帧数据中的经度数据和纬度数据,并对各个路径点进行标记;所述记录设备用于记录和存储位置数据;所述交互输入设备用于输入骑行目的地;所述交互显示设备用于显示用户的实时位置和骑行路径。2.根据权利要求1所述的限制性骑行路径规划装置,其特征在于,所述主机控制器和所述从机控制器采用STM32F103VET6单片机,所述定位接收器是UBLOX-NEO-6M模组和STM32F103VET6上自带的AT24C02EEPROM模块,其中,UBLOX-NEO-6M模组作为GPS信号分析处理模组,AT24C02存储GPS配置信息;所述记录设备采用MicroSD卡;所述交互输入设备采用按键模块;所述交互显示设备采用带ILI9341控制器的TFL液晶屏。3.根据权利要求2所述的限制性骑行路径规划装置,其特征在于,所述主机电路还包括第一无线通信模块,所述第一无线通信模块与所述主机控制器连接,所述从机电路还包括第二无线通信模块,所述第二无线通信模块与所述从机控制器连接;所述第一无线通信模块和所述第二无线通信模块用于实现所述主机电路和所述从机电路之间的无线通信。4.根据权利要求3所述的限制性骑行路径规划装置,其特征在于,所述第一无线通信模块和所述第二无线通信模块采用STM32F103VET6单片机上自带的ESP8266WiFi模块。5.一种限制性骑行路径规划方法,其特征在于,应用于权利要求1至4任一所述的限制性骑行路径规划装置中,所述方法包括:确定预定区域内的各个路径点,所述路径点为至少两条道路的交汇点;采集各个路径点的经纬度数据,记录各个路径点的海拔高度,对每个路径点预设风景评分,将每个路径点的经纬度数据、海拔高度、风景评分对应存储;接收用户选择的起点和终点,对于每个行驶路段,获取同时间段内GPS数据中其他骑行者的所有骑行路径,确定出起点与终点之间的所有待选路径集合,所述待选路径集合包括有向路段集、每条待选路径的最大海拔差集和每条待选路径的综合风景评分集;接收用户选择的骑行模式,所述骑行模式包括最短距离模式、风景最优模式、锻炼身体模式;根据用户选择的骑行模式,通过约束深度强化学习算法确定出对骑行模式对应的目标路径。6.根据权利要求5所述的限制性骑行路径规划方法,其特征在于,所述骑行模式为最短距离模式,所述通过约束深度强化学习算法确定出对骑行模式对应的目标路径,包括:待选路径集合W中包括所有路径点组成的路径点集E和有向路径集A,用户的起点位置ei为路径点集E中的第i个路径点,将用户的起点位置ei的状态特征表示为s(ei)=[xi,yi,xD,yD],xi表示起点的经度,yi表示起点的纬度,xD表示终点的经度,yD表示终点的纬度;起点位置ei到终点的骑行时间用Q(s(ei))表示,将起点位置ei的状态特征s(ei)输入BP神经网络得到起点到终点的骑行时间Q(s(ei));用户在待选路径集合G中所在路径点ei+n∈E,ei+n表示在起点位置ei后的第n个路径点,与起点位置ei相连接的所有路段ai,j组成起点位置ei的有向路径集A(ei);奖励函数r(ei,ai,i+1)表示用户在起点位置ei选择路段ai,i+1的骑行时间Q(s(ei));根据骑行经验执行贪婪策略π和环境交互得到由所在路径点、选择的相邻路段和骑行时间组成的求解:hi:k=ei,ai,i+1,r(ei,ai,i+1),ei+1,ai+1,i+2,...,ek,ek表示终点之前所经过的最后一个路口,即路径点集E中的第k个路径点;当完成一次求解,Q值发生更新,将求解中用户在起点位置ei以及之后经过的每个路径点表示为[s(ei),ai,i+1,r(ei,ai,i+1),s(ei+1)]存储于求解记忆P中;当每次完成成功求解时,计算成功求解中每个起点位置ei到终点位置的累积折减收益G(hi:k);定义节点记忆N={[s(ei),q(ei)|ei∈E,q(ei)=minG(hi:k)]},二元组s(ei),q(ei)存储起点位置ei的状态特征和起点到终点的最短骑行时间;采用深度Q-learning算法,神经网路的训练通过最小化起点位置ei到终点的最短骑行时间q(ei)和起点位置ei到终点的骑行时间估计值Q(s(ei))误差平方和,即其中θ为神经网络权重系数;采用ε贪婪策略,以ε概率选择当前最佳策略,1-ε概率随机选择策略,基于深度Q-learning算法,结合待选路径集合W,选择对应最短距离模式的路径,具体步骤包括:输入W=(E,A);初始化节点记忆N,循环执行初始化Q值及神经网络权重系数θ,嵌套循环1至k,在起点位置ei用户满足交通规则时,采用ε贪婪策略选择和起点位置相连的路段ai,i+1;将选择记录[s(ei),ai,i+1,r(ei,ai,i+1)]加入求解,并将记录[s(ei),ai,i+1,r(ei,ai,i+1),s(ei+1)]存储于求解记忆P,直到最后一个路径点ek和终点eD重合结束循环;计算成功从起点到终点的路径中每个起点位置ei到终点的累积折减收益G(hi:k),并更新节点记忆N;使用梯度下降更新θ,以最小化[(q(ei)-Q(s(ei),θ))]2,输出贪婪策略ai,i+1=π(ei),得到所选择的一个路段,到达终点后,所有选择的路段组成的路径即与最短距离模式对应的路径。7.根据权利要求5所述的限制性骑行路径规划方法,其特征在于,所述骑行模式为风景最优模式,所述通过约束深度强化学习算法确定出对骑行模式对应的目标路径,包括:根据骑行经验设定风景评分初始值g0,待选路径集合W中包括所有路径点组成的路径点集E、有向路径集A...

【专利技术属性】
技术研发人员:王子赟阮悦颖张洁陈悦林叶小玮陆妍
申请(专利权)人:江南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1