System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于手机信令历史数据强化学习的特征提取方法技术_技高网
当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于手机信令历史数据强化学习的特征提取方法技术

技术编号:40918316 阅读:2 留言:0更新日期:2024-04-18 14:44
本发明专利技术公开了一种基于手机信令历史数据强化学习的特征提取方法,首先根据最近一段时间内的手机信令历史数据,构建历史数据库;然后进行二重手机信令数据强化学习,第一重强化学习为数据特征学习,输出具有高可信度的用户完整出行序列数据;第二重强化学习为出行行为学习,输出三种运动状态的运动状态模糊权重,并构造模糊出行隶属集;接着,提出基于模糊出行隶属度的三支高斯混合聚类算法,对用户完整出行序列数据进行聚类划分;提出双动态POI相似映射算法,通过结合土地信息对算法参数进行动态调整,确定用户精确出行起讫点及完整出行链。本发明专利技术方法提升了用户手机信令数据利用率,有效地解决了用户出行分析与数据统计精确度的问题。

【技术实现步骤摘要】

本专利技术涉及手机信令数据处理领域,特别涉及一种基于手机信令历史数据强化学习的特征提取方法


技术介绍

1、随着手机功能的逐渐强大,人们的日常生活中也变得越来越离不开手机,像手机支付,手机导航,手机查询信息等,让手机能够基本上做到全天候伴随使用者左右,使得手机的位置信息能够极大程度上代表使用者的位置信息。所以在出行信息采集技术方面,手机信令数据作为采集数据源之一被广泛应用。

2、目前在基于手机信令的出行分析技术方面,主要采用两种方式进行出行起讫点的识别,一是通过手机信令数据切换和位置更新信息判定轨迹的转变从而确定起讫节点;第二类则是采用基于层次或密度的聚类算法进行确定。

3、但当前广泛应用的技术手段仍无法完美解决问题,尤其在手机信号基站存在坐标识别误差的情况下,用户地理信息的精准获取会存在一定的困难。同时,基站区域的划分与交通小区划分之间存在的不兼容问题也会导致对用户位置信息识别的错误,出现数据漂移以及乒乓现象,进一步加剧出行起讫点识别的误差。

4、此外,在算法方面,针对手机信令数据处理的算法也还存在噪音数据处理不到位,数据的出行模式归属划分界定不清晰、阈值设置不明确,点位数据聚类效果不理想,出行模式与方式选择的识别较为困难等问题,最终导致数据利用率不足,出行分析结果与实际不符合等一系列痛点,需要有针对性地进行新方法的探索。


技术实现思路

1、本专利技术所要解决的问题是:提供一种基于手机信令历史数据强化学习的特征提取方法,用于解决用户出行分析与数据统计精确度,以及提升手机信令数据利用率的问题。

2、本专利技术采用如下技术方案:一种基于手机信令历史数据强化学习的特征提取方法,包括如下步骤:

3、s10、根据最近一段时间内的手机信令历史数据,构建历史数据库,用于二重手机信令数据强化学习;

4、s20、第一重强化学习,数据特征学习:构造多通道卷积贝叶斯学习算法,学习手机信令历史数据的信号强度、时间长度以及坐标信息特征,对用户初始手机信令数据中存在的漂移数据与乒乓数据进行剔除,并对缺失数据点进行补全,输出具有高可信度的用户完整出行序列数据;

5、s30、第二重强化学习,出行行为学习:定义出行重合度的计算,对与用户完整出行序列数据具有较高出行重合度的历史数据进行学习,将数据分解为出行、静止以及小范围活动三种运动状态,输出三种运动状态的运动状态模糊权重,并构造模糊出行隶属集;

6、s40、结合模糊出行隶属集,提出基于模糊出行隶属度的三支高斯混合聚类算法,对用户完整出行序列数据进行聚类划分,提取出行集以及包含静止集、边缘运动集两个子集的停留点点集,并计算出各停留点点集的覆盖域;

7、s50、借助地图平台api接口,读取停留点点集覆盖范围内土地利用信息,提出双动态poi相似映射算法,通过结合土地信息对算法参数进行动态调整,对停留点点集进行地理信息映射与poi匹配,输出用户的精确起讫点与完整出行链;

8、s60、对所有用户数据进行读取与处理,按时间划分输出同一天内各交通小区间的出行od矩阵,以及用户出行模式与规律的统计结果,并将用户数据结果反馈回s10所述历史数据库,进行参数更新。

9、具体的,根据手机信令历史数据特征,s10历史数据库中存储的每条点位数据内容包括用户标识符、用户手机号码、每条数据包括日期与时间信息的时间戳记录、包括经纬度坐标以及基站归属的位置信息、反映基站与手机之间的信号质量的信号强度信息以及动静三值权重,数据的记录格式为:

10、ms(u1,u2,…,us)

11、us(i)={us,usp,date,mm,(lo,la,lci),si,tra(j)}t

12、其中,ms(us)为完整用户手机信令历史数据样本,us(i)指用户出行序列数据us的第i点位数据,usp为用户us的手机号码,date为格式为年/月/日的日期数据,mm为格式为时/分/秒的时长数据,lo为用户的经度坐标,la为用户的纬度坐标,lci为基站小区归属坐标,si为信号强度,tra(j)为第j类运动状态模糊权重值,t表示矩阵转置。

13、具体的,s20中,漂移数据指用户数据出现数据记录在短时间内突变至一个异常值再切换回原值的噪音数据;乒乓数据指用户数据的数据记录在两基站覆盖区域内来回切换的噪音数据;二重手机信令数据强化学习中的第一重强化学习,包括以下步骤:

14、s21、对s10中历史数据以及s20中用户初始数据进行格式转换,将时间戳数据、经纬度坐标与信号强度信息进行归一化,确保尺度一致;

15、s22、构建多通道卷积贝叶斯学习算法,对历史数据进行学习,根据学习结果,对用户数据计算异常分数,根据动态阈值进行异常数据的剔除与贝叶斯处理。

16、多通道卷积贝叶斯学习算法,包括以下步骤:

17、s221、将手机信令历史数据作为输入进行特征学习,在信号强度通道上进行cnn一阶学习,输出一维卷积特征学习结果,表示如下:

18、

19、其中,x1(i)为第i点位数据的一维卷积特征学习结果,bsi为信号强度偏置值,ωsi为信号强度权重,psil(i)为第i点位数据的信号损失概率,为一维卷积输入,n为信令信息输入数据量;

20、s222、在s221的基础上,结合时间通道进行cnn二阶学习,输出二维卷积特征学习结果,表示如下:

21、

22、其中,x2(i)为第i点位数据的二维卷积特征学习结果,btim为时间戳偏置值,σtim为时间弥补参数,ωtim为时间权重,ptiml(i)为第i点位数据的时间损失概率,为二维卷积输入,n、p为信令信息输入数据量;

23、s223、在s222的基础上,结合坐标通道进行cnn三阶学习,输出三维卷积特征学习结果,表示如下:

24、

25、其中,x3(i)为第i点位数据的三维卷积特征学习结果,bloa为坐标偏置值,σloa为坐标平衡参数,ωloa为坐标权重,ploal(i)为第i点位数据的坐标损失概率,为三维卷积输入,n、p、q为信令信息输入数据量;

26、s224、引入用户初始数据,对每个点位数据进行异常分数计算:

27、

28、其中:

29、

30、as(i)为用户数据us的第i点位数据的异常分数值,asm(i)为第m维度下的异常残差,ρm为维度指数,xm(i)第m维度下的卷积特征学习结果,j表示历史数据总数,有j=1,2,…,j;

31、usi(si)、usi(mm)、usi(loa)分别为用户数据中第i点位数据的信号强度、时长数据以及用户坐标值,hj(si)、hj(mm)、hj(loa)分别为第j条历史数据下的信号强度、时长信息,以及坐标信息;

32、sd、dd、td分别为一维、二维及三维数据形式,ωs、ωd、ωt分别为一维、二维及三本文档来自技高网...

【技术保护点】

1.一种基于手机信令历史数据强化学习的特征提取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,根据手机信令历史数据特征,历史数据库中存储的每条点位数据内容包括:用户标识符、用户手机号码、包含日期与时间信息的时间戳记录、包含经纬度坐标以及基站归属的位置信息、信号强度信息、以及动静三值权重,数据的记录格式为:

3.根据权利要求2所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,所述漂移数据为用户数据出现数据记录在短时间内突变至一个异常值再切换回原值的噪音数据;所述乒乓数据为用户数据的数据记录在两基站覆盖区域内来回切换的噪音数据;所述第一重强化学习,包括以下子步骤:

4.根据权利要求3所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,S22中多通道卷积贝叶斯学习算法,具体包括以下步骤:

5.根据权利要求4所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,第二重强化学习,包括以下步骤:

6.根据权利要求5所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,步骤S40中,基于模糊出行隶属度的三支高斯混合聚类算法,包括以下子步骤:

7.根据权利要求6所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,步骤S50中,双动态POI相似映射算法,具体包括以下步骤:

8.根据权利要求1所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,对所有用户数据进行读取与处理后,将用户完整的出行序列数据与运动状态模糊权重{Tra}返回S10所述历史数据库中,进行参数更新,用于对下一用户的手机信令数据进行同样的数据学习与数据处理;参数包括用户完整的出行序列数据运动状态模糊权重{Tra}。

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时,实现权利要求1至8中任一项所述的基于手机信令历史数据强化学习的特征提取方法中的步骤。

...

【技术特征摘要】

1.一种基于手机信令历史数据强化学习的特征提取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,根据手机信令历史数据特征,历史数据库中存储的每条点位数据内容包括:用户标识符、用户手机号码、包含日期与时间信息的时间戳记录、包含经纬度坐标以及基站归属的位置信息、信号强度信息、以及动静三值权重,数据的记录格式为:

3.根据权利要求2所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,所述漂移数据为用户数据出现数据记录在短时间内突变至一个异常值再切换回原值的噪音数据;所述乒乓数据为用户数据的数据记录在两基站覆盖区域内来回切换的噪音数据;所述第一重强化学习,包括以下子步骤:

4.根据权利要求3所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,s22中多通道卷积贝叶斯学习算法,具体包括以下步骤:

5.根据权利要求4所述的基于手机信令历史数据强化学习的特征提取方法,其特征在于,第二重...

【专利技术属性】
技术研发人员:李昊李志斌郑茂程
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1