基于手机信令的行为特征提取方法及相关装置制造方法及图纸

技术编号:33835992 阅读:49 留言:0更新日期:2022-06-16 11:52
本发明专利技术涉及大数据技术领域,提供了一种基于手机信令的行为特征提取方法及相关装置,所述方法包括:获取用户的行为编码,其中,行为编码是用户在预设时间段内、按照驻留时间顺序对驻留信息进行编码得到的,用户的驻留信息是根据用户的手机信令得到的;利用预设概率分布,确定行为编码在预设主题下的概率;根据行为编码在预设主题下的概率,计算用户的行为特征,其中,用户的行为特征的维度等于预设主题的个数。由于本发明专利技术得到的行为特征更准确、更全面,能够充分反映用户的出行行为。能够充分反映用户的出行行为。能够充分反映用户的出行行为。

【技术实现步骤摘要】
基于手机信令的行为特征提取方法及相关装置


[0001]本专利技术涉及大数据
,具体而言,涉及一种基于手机信令的行为特征提取方法及相关装置。

技术介绍

[0002]现有技术利用手机信令数据刻画用户的出行的行为特征,通常采用统计的方式:利用手机信令数据得到用户的出行里程、出行次数、出行时间等相关特征描述用户的出行行为,通过对用户的常去地点归纳,得到了居住地、工作地和到访地等粗略的信息,统计上下班时间规律、节假日周末外出频次等信息作为刻画用户的行为特征。
[0003]现有的统计方式不能充分挖掘出手机信令数据中的有效信息,因而得到行为特征不能充分反映用户的出行行为的行为特征。

技术实现思路

[0004]本专利技术的目的在于提供了一种基于手机信令的行为特征提取方法及相关装置,其能够利用预设概率分布,对带有驻留时间顺序的用户的行为编码进行特征提取,以得到充分反映用户的出行行为的行为特征。
[0005]为了实现上述目的,本专利技术实施例采用的技术方案如下:
[0006]第一方面,本专利技术实施例提供一种基于手机信令的行为特征提取方法,所述方法包括:获取用户的行为编码,其中,所述行为编码是用户在预设时间段内、按照驻留时间顺序对驻留信息进行编码得到的,所述用户的驻留信息是根据所述用户的手机信令得到的;利用预设概率分布,确定所述行为编码在预设主题下的概率;根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征,其中,所述用户的行为特征的维度等于所述预设主题的个数。
[0007]进一步地,所述驻留信息包括驻留地点、驻留起始时间、驻留时长及驻留日期,所述获取用户的行为编码的步骤包括:
[0008]根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型;
[0009]根据预设区间分段确定与所述驻留起始时间对应的目标区间分段,其中,所述预设区间分段是对一天内时间区间划分后得到的;
[0010]根据预设时长分段确定与所述驻留时长对应的目标时长分段,其中,所述预设时长分段是对一天内的时长划分后得到的;
[0011]根据预设的日期与日期特征之间的映射关系,确定与所述驻留日期对应的目标日期特征;
[0012]根据所述目标预设地点类型、所述目标区间分段、所述目标时长分段及所述目标日期特征,生成所述行为编码。
[0013]进一步地,所述预设区域包括多个栅格,每一所述栅格对应一个预设地点类型,所
述根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型的步骤包括:
[0014]确定所述驻留地点所属的目标栅格;
[0015]将所述目标栅格对应的预设地点类型作为所述目标预设地点类型。
[0016]进一步地,所述行为编码为多个,所述预设主题为多个,所述预设主题的数量小于所述行为编码的数量,所述行为编码在预设主题下的概率包括每一所述行为编码在每一所述预设主题下的概率,所述根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征的步骤包括:
[0017]计算所有所述行为编码在每一所述预设主题下的概率的平均值,得到每一所述预设主题对应的行为特征;
[0018]将所有预设主题对应的行为特征作为所述用户的行为特征。
[0019]进一步地,所述方法还包括:
[0020]获取语料库,其中所述语料库包括多个用户的行为编码;
[0021]对所述语料库进行吉布斯采样,确定预设联合分布的第一预设参数和第二预设参数,其中,所述预设联合分布用于表征所述预设主题和所述语料库中的行为编码的联合分布,所述第一预设参数用于表征语料库中预设主题的分布参数,所述第二预设参数用于表征语料库中行为编码与所述预设主题的分布参数;
[0022]根据所述预设联合分布、所述第一预设参数及所述第二预设参数,对所述预设主题进行汇总,得到边缘分布;
[0023]根据所述预设联合分布和所述边缘分布,确定所述预设概率分布。
[0024]进一步地,所述第一预设参数包括第一分布参数和第二分布参数,其中,所述第一分布参数用于表征所述预设主题的多项分布的参数,所述第二分布参数用于表征所述第一分布参数的狄利克雷分布的参数。
[0025]进一步地,所述预设主题的个数为K,对所述语料库中行为编码去重后的行为编码的个数为V,所述第二预设参数为K
×
V的矩阵。
[0026]第二方面,本专利技术实施例提供一种基于手机信令的行为特征提取装置,所述装置包括:获取模块,用于获取用户的行为编码,其中,所述行为编码是用户在预设时间段内、按照驻留时间顺序对驻留信息进行编码得到的,所述用户的驻留信息是根据所述用户的手机信令得到的;确定模块,用于利用预设概率分布,确定所述行为编码在预设主题下的概率;计算模块,用于根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征,其中,所述用户的行为特征的维度等于所述预设主题的个数。
[0027]第三方面,本专利技术实施例提供一种电子设备,包括控制器和存储器;所述存储器用于存储程序;所述控制器用于在执行所述程序时,实现如上述第一方面的基于手机信令的行为特征提取方法。
[0028]第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被控制器执行时实现如上述第一方面的基于手机信令的行为特征提取方法。
[0029]本专利技术实施例在获取用户在预设时间段内、按照驻留时间顺序对根据用户的手机信令得到驻留信息进行编码得到的行为编码后,利用预设概率分布,确定行为编码在预设主题下的概率,再根据行为编码在预设主题下的概率,计算用户的行为特征,用户的行为特
征的维度等于预设主题的个数。与现有技术相比,由于本专利技术实施例是对带有驻留时间顺序的行为编码、利用预设概率分布进行概率计算,得到的行为特征,因此,该行为特征更准确、更全面,能够充分反映用户的出行行为。
附图说明
[0030]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0031]图1为本专利技术实施例提供的一种基于手机信令的行为特征提取方法的流程图。
[0032]图2为本专利技术实施例提供的另一种基于手机信令的行为特征提取方法的流程图。
[0033]图3为本专利技术实施例提供的另一种基于手机信令的行为特征提取方法的流程图。
[0034]图4为本专利技术实施例提供的另一种基于手机信令的行为特征提取方法的流程图。
[0035]图5为本专利技术实施例提供的基于手机信令的行为特征提取装置的方框示意图。
[0036]图6为本专利技术实施例提供的电子设备的方框示意图。
[0037]图标:10
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于手机信令的行为特征提取方法,其特征在于,所述方法包括:获取用户的行为编码,其中,所述行为编码是用户在预设时间段内、按照驻留时间顺序对驻留信息进行编码得到的,所述用户的驻留信息是根据所述用户的手机信令得到的;利用预设概率分布,确定所述行为编码在预设主题下的概率;根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征,其中,所述用户的行为特征的维度等于所述预设主题的个数。2.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述驻留信息包括驻留地点、驻留起始时间、驻留时长及驻留日期,所述获取用户的行为编码的步骤包括:根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型;根据预设区间分段确定与所述驻留起始时间对应的目标区间分段,其中,所述预设区间分段是对一天内时间区间划分后得到的;根据预设时长分段确定与所述驻留时长对应的目标时长分段,其中,所述预设时长分段是对一天内的时长划分后得到的;根据预设的日期与日期特征之间的映射关系,确定与所述驻留日期对应的目标日期特征;根据所述目标预设地点类型、所述目标区间分段、所述目标时长分段及所述目标日期特征,生成所述行为编码。3.如权利要求2所述的基于手机信令的行为特征提取方法,其特征在于,所述预设区域包括多个栅格,每一所述栅格对应一个预设地点类型,所述根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型的步骤包括:确定所述驻留地点所属的目标栅格;将所述目标栅格对应的预设地点类型作为所述目标预设地点类型。4.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述行为编码为多个,所述预设主题为多个,所述预设主题的数量小于所述行为编码的数量,所述行为编码在预设主题下的概率包括每一所述行为编码在每一所述预设主题下的概率,所述根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征的步骤包括:计算所有所述行为编码在每一所述预设主题下的概率的平均值,得到每一所述预设主题对应的行为特征;将所有预设主题对应的行为特征作为所述用户的行为特征。5....

【专利技术属性】
技术研发人员:张航张岩闫嘉
申请(专利权)人:智慧足迹数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1