场所之间关联度的评估方法和评估系统技术方案

技术编号:20546649 阅读:62 留言:0更新日期:2019-03-09 19:33
本发明专利技术公开了一种场所之间关联度的评估方法和评估系统,其中该评估方法包括:获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。本发明专利技术的技术方案以场所的用户信息作为数据支撑,能够客观、准确的对场所之间关联度进行评估和量化,便于后续作进一步的分析。

Assessment Method and System of the Relevance Degree between Places

The invention discloses an evaluation method and an evaluation system for the degree of association between places, in which the evaluation method includes: acquiring user information corresponding to each place in a predetermined time period, the user information includes: the identity information of each user appearing in the corresponding place within the predetermined time period and the corresponding frequency of each user appearing; and corresponding to each place according to the said place. The user information evaluates the degree of association between any two said sites. The technical scheme of the invention takes the user information of the place as the data support, and can objectively and accurately evaluate and quantify the correlation degree between places, so as to facilitate further analysis in the follow-up.

【技术实现步骤摘要】
场所之间关联度的评估方法和评估系统
本专利技术涉及大数据
,特别涉及一种场所之间关联度的评估方法和评估系统。
技术介绍
研究不同场所之间的关联性,建立场所之间的关联网,是大数据研究领域的热门方向。然而,当前对场所之间关联度的评估主要是依据人为主观感受,没有相应的数据支撑。为此,提供一种相对客观、能够真实反映场所之间关联度的评估方法,是本领域亟需解决的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,提出了一种场所之间关联度的评估方法和评估系统。为实现上述目的,本专利技术提供了一种场所之间关联度的评估方法,包括:获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。可选地,所述预设时间段包括:若干个统计周期;所述获取在预设时间段内各场所所对应的用户信息的步骤包括:在每一个统计周期内,针对每一个场所,获取在该统计周期内出现于该场所的各用户的所述身份信息,并将相应用户在该统计周期内出现于该场所的出现频数记为1;针对每一个场所,统计出在预设时间段内出现于该场所的各用户的身份信息和各用户对应的出现频数。可选地,所述身份信息包括:相应用户所携带的移动终端的MAC地址;所述获取在该统计周期内出现于该场所的各用户的身份信息的步骤包括:在该统计周期内,实时扫描位于该场所内的全部所述移动终端的MAC地址,并将扫描到的MAC地址作为相应用户的身份信息。可选地,所述根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度步骤包括:以出现频数作为特征,根据各所述场所对应的所述用户信息,生成各所述场所的特征向量;计算待评估的两个所述场所的特征向量之间的相似度,以作为该待评估的两个所述场所之间的关联度。可选地,所述场所的个数为J,J个所述场所对应J个所述用户信息;所述根据各所述场所的所述用户信息,生成各所述场所的特征向量的步骤包括:从J个所述用户信息中,剔除仅在一个所述场所中出现过的用户的所述身份信息和该用户对应的出现频数;完成数据剔除后,J个所述用户信息中总计包括I个不同用户的身份信息;以J个不同场作为J个文件,I个用户作为I个词,采用TF-IDF算法提取各场所的特征向量,具体包括:计算各用户在各场所对应的词频:其中,tfi,j表示第i个用户在第j个场所的词频,ni,j表示在预设时间段内第i个用户在第j个场所的出现频数,i∈[1,I]且i为整数,j∈[1,J]且j为整数;计算各用户的逆向文件频率:其中,idfi表示第i个用户对应的逆向文件频率,dj表示第j个场所,|j:ti∈dj|表示在预设时间段内出现过第i用户的场所的总数量;计算各用户在各场所对应的权重评分:tfidfi,j=tfi,j×idfi其中,tfidfi,j表示第i个用户在第j个场所的权重评分;生成各场所的特征向量:Aj=(tfidf1,j,tfidf2,j,...,tfidfI,j)其中,Aj表示第j个场所的特征向量。可选地,所述计算待评估的两个所述场所的特征向量之间的相似度的步骤包括:计算待评估的两个所述场所的特征向量之间的距离,并将计算结果作为待评估的两个所述场所的特征向量之间的相似度。为实现上述目的,本专利技术还提供了一种场所之间关联度的评估系统,包括:获取模块,用于获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;评估模块,用于根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。可选地,所述预设时间段包括:若干个统计周期;所述获取模块包括:获取单元,用于在每一个统计周期内,针对每一个场所,获取在该统计周期内出现于该场所的各用户的所述身份信息,并将相应用户在该统计周期内出现于该场所的出现频数记为1;统计单元,用于针对每一个场所,统计出在预设时间段内出现于该场所的各用户的身份信息和各用户对应的出现频数。可选地,所述身份信息包括:相应用户所携带的移动终端的MAC地址;所述获取单元包括:与所述场所一一对应的若干个扫描子单元;所述扫描子单元用于在统计周期内实时扫描位于对应场所内的全部所述移动终端的MAC地址,并将扫描到的MAC地址作为相应用户的身份信息。可选地,所述评估模块包括:特征向量生成单元,用于以出现频数作为特征,根据各所述场所对应的所述用户信息,生成各所述场所的特征向量;计算单元,用于计算待评估的两个所述场所的特征向量之间的相似度,以作为该待评估的两个所述场所之间的关联度。可选地,所述场所的个数为J,J个所述场所对应J个所述用户信息;所述特征向量生成单元包括:数据剔除单元,用于从J个所述用户信息中,剔除仅在一个所述场所中出现过的用户的所述身份信息和该用户对应的出现频数;完成数据剔除后,J个所述用户信息中总计包括I个不同用户的身份信息;特征向量提取单元,用于以J个不同场作为J个文件,I个用户作为I个词,采用TF-IDF算法提取各场所的特征向量;所述特征向量提取单元包括:第一计算子单元,用于计算各用户在各场所对应的词频:其中,tfi,j表示第i个用户在第j个场所的词频,ni,j表示在预设时间段内第i个用户在第j个场所的出现频数,i∈[1,I]且i为整数,j∈[1,J]且j为整数;第二计算子单元,用于计算各用户的逆向文件频率:其中,idfi表示第i个用户对应的逆向文件频率,dj表示第j个场所,|j:ti∈dj|表示在预设时间段内出现过第i用户的场所的总数量;第三计算子单元,用于计算各用户在各场所对应的权重评分:tfidfi,j=tfi,j×idfi其中,tfidfi,j表示第i个用户在第j个场所的权重评分;生成子单元,用于生成各场所的特征向量:Aj=(tfidf1,j,tfidf2,j,...,tfidfI,j)其中,Aj表示第j个场所的特征向量。可选地,所述计算单元包括:距离计算子单元,用于计算待评估的两个所述场所的特征向量之间的距离,并将计算结果作为待评估的两个所述场所的特征向量之间的相似度。本专利技术具有以下有益效果:本专利技术的提供了一种场所之间关联度的评估方法和评估系统,本专利技术的技术方案以场所的用户信息作为数据支撑,能够客观、准确的对场所之间关联度进行评估和量化,便于后续作进一步的分析。附图说明图1为本专利技术实施例一提供的一种场所之间关联度的评估方法的流程图;图2为本专利技术实施例二提供的一种场所之间关联度的评估方法的流程图;图3为本专利技术实施例三提供的一种场所之间关联度的评估系统的结构示意图。具体实施方式为使本领域的技术人员更好地理解本专利技术的技术方案,下面结合附图对本专利技术提供的一种场所之间关联度的评估方法和评估系统进行详细描述。在本专利技术中,“场所”可以为预先定义的区域,例如将一间房子所对应的区域作为一个场所,将一个学校所对应的区域作为一个场所,将一个行政区作为一个场所。“用户”具体指代人。若在某一段时间内,某一个用户频繁多次出现于两个不同的区域,则可在一定程度上反映出这两个区域存在一定的关联性。基于上述原理,本专利技术提供了一种场所之间关联度的评估方法和评估系统。图1为本专利技术实施本文档来自技高网...

【技术保护点】
1.一种场所之间关联度的评估方法,其特征在于,包括:获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。

【技术特征摘要】
1.一种场所之间关联度的评估方法,其特征在于,包括:获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。2.根据权利要求1所述的场所之间关联度的评估方法,其特征在于,所述预设时间段包括:若干个统计周期;所述获取在预设时间段内各场所对应的用户信息的步骤包括:在每一个统计周期内,针对每一个场所,获取在该统计周期内出现于该场所的各用户的所述身份信息,并将相应用户在该统计周期内出现于该场所的出现频数记为1;针对每一个场所,统计出在预设时间段内出现于该场所的各用户的身份信息和各用户对应的出现频数。3.根据权利要求2所述的场所之间关联度的评估方法,其特征在于,所述身份信息包括:相应用户所携带的移动终端的MAC地址;所述获取在该统计周期内出现于该场所的各用户的身份信息的步骤包括:在该统计周期内,实时扫描位于该场所内的全部所述移动终端的MAC地址,并将扫描到的MAC地址作为相应用户的身份信息。4.根据权利要求1所述的场所之间关联度的评估方法,其特征在于,所述根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度步骤包括:以出现频数作为特征,根据各所述场所对应的所述用户信息,生成各所述场所的特征向量;计算待评估的两个所述场所的特征向量之间的相似度,以作为该待评估的两个所述场所之间的关联度。5.根据权利要求4所述的场所之间关联度的评估方法,其特征在于,所述场所的个数为J,J个所述场所对应J个所述用户信息;所述根据各所述场所的所述用户信息,生成各所述场所的特征向量的步骤包括:从J个所述用户信息中,剔除仅在一个所述场所中出现过的用户的所述身份信息和该用户对应的出现频数;完成数据剔除后,J个所述用户信息中总计包括I个不同用户的身份信息;以J个不同场作为J个文件,I个用户作为I个词,采用TF-IDF算法提取各场所的特征向量,具体包括:计算各用户在各场所对应的词频:其中,tfi,j表示第i个用户在第j个场所的词频,ni,j表示在预设时间段内第i个用户在第j个场所的出现频数,i∈[1,I]且i为整数,j∈[1,J]且j为整数;计算各用户的逆向文件频率:其中,idfi表示第i个用户对应的逆向文件频率,dj表示第j个场所,|j:ti∈dj|表示在预设时间段内出现过第i用户的场所的总数量;计算各用户在各场所对应的权重评分:tfidfi,j=tfi,j×idfi其中,tfidfi,j表示第i个用户在第j个场所的权重评分;生成各场所的特征向量:Aj=(tfidf1,j,tfidf2,j,...,tfidfI,j)其中,Aj表示第j个场所的特征向量。6.根据权利要求4所述的场所之间关联度的评估方法,其特征在于,所述计算待评估的两个所述场所的特征向量之间的相似度的步骤包括:计算待评估的两个所述场所的特征向量之间的距离,并将计算结果作为待评估的两个所述场所的特征向量之间的相似度。7.一种场所之间关联度的评估系统,其特...

【专利技术属性】
技术研发人员:李鹏陆承恩
申请(专利权)人:北京酷云互动科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1