一种移动社会网络中的人群划分方法技术

技术编号:9870954 阅读:131 留言:1更新日期:2014-04-03 23:51
本发明专利技术公开了一种移动社会网络中的人群划分方法,包括以下步骤:a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度si,j;b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U;c、导入用户社交活动日志,根据用户彼此之间的手机呼叫历史记录建立社交网络模型,计算社交网络邻接矩阵F;d、计算分块矩阵并划分人群。本发明专利技术通过对手机网络或基于位置在线社交网络中的用户精准划分,可应用于个性化内容推荐系统,向目标用户推送个性化内容。

【技术实现步骤摘要】

本专利技术涉及数据挖掘与用户行为分析技术,具体涉及。通过对手机网络或基于位置在线社交网络中的用户精准划分,可应用于个性化内容推荐系统。
技术介绍
准确划分人群中的社团或聚类对于优化基于位置的互联网服务等个性化内容推荐系统具有重大意义,根据人群划分结果,可准确地向目标用户推送个性化内容。现有划分人群的方法一般可以分为基于社会网络社团探测方法和基于数据特征的聚类方法。一方面,基于社会网络的社团探测的方法根据个体之间的社交关系的紧密程度来划分传统意义上的社团,由于这种方法获得的社团可以很直观的反映社团内外的社交关系,因此很容易用来分析并解释一些普遍现象,可以很方便的应用到纯社交网络服务推荐或其他与社交关系紧密相关的问题研究中,但是人群并不一定仅仅具有社交属性,其他属性例如地理属性,社会属性等同样影响到个体的行为乃至社团的划分,进而影响其应用面。另一方面,基于共同特征的数据聚类方法在数据挖掘领域已经有很多应用。这种方法基于不同个体维度的属性的相似性来获得个体之间的共同特征的聚类,从而划分不同类型的人群。这种方法已广泛应用到例如电子商务、多媒体内容推送等个性化推荐领域中,但这种方法针对性相对较强,仅能分析并探测用户在特定属性维度上的行为。
技术实现思路
针对现有技术的不足,本专利技术的目的在于提出,该方法基于离散地理轨迹相似性,同时结合个体的地理属性与社交属性,划分更为精准。为实现以上专利技术目的,本专利技术采用以下技术方案:,包括以下步骤:a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度Si,j,其中,给定总用户数N,用户活动区域由M个基站完全覆盖,所述用户地理轨迹日志由用户ID与用户活动的基站序号列表组成;b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U,其中,N*M维User-Locate矩阵U的矩阵兀素PVij表示用户i在位置j的出现概率;M*N维Locate-User矩阵L的矩阵元素LVij表示位置i上用户j出现的概率;N*N维User-User相似性矩阵G为:本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201310686372.html" title="一种移动社会网络中的人群划分方法原文来自X技术">移动社会网络中的人群划分方法</a>

【技术保护点】
一种移动社会网络中的人群划分方法,包括以下步骤:a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度si,j,其中,给定总用户数N,用户活动区域由M个基站完全覆盖,所述用户地理轨迹日志由用户ID与用户活动的基站序号列表组成;b、基于任意两用户的离散地理轨迹相似度,建立User‑User相似性矩阵G、Locate‑User矩阵L和User‑Locate矩阵U,其中,N*M维User‑Locate矩阵U的矩阵元素PVij表示用户i在位置j的出现概率;M*N维Locate‑User矩阵L的矩阵元素LVij表示位置i上用户j出现的概率;N*N维User‑User相似性矩阵G为:其中,各矩阵元素对应用户列表中对应位置的用户对的地理相似度;c、导入用户社交活动日志,根据用户彼此之间的手机呼叫历史记录建立社交网络模型,计算社交网络邻接矩阵F,其中,社交网络邻接矩阵F为N*N维矩阵,矩阵元素Vij表示用户i,j的社交关系的权重;d、计算分块矩阵并划分人群。FDA0000438890810000011.jpg

【技术特征摘要】
1.一种移动社会网络中的人群划分方法,包括以下步骤: a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度Si,j,其中,给定总用户数N,用户活动区域由M个基站完全覆盖,所述用户地理轨迹日志由用户ID与用户活动的基站序号列表组成; b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U,其中,N*M维User-Locate矩阵U的矩阵兀素PVij表示用户i在位置j的出现概率;M*N维Locate-User矩阵L的矩阵元素LVij表示位置i上用户j出现的概率;N*N维User-User相似性矩阵G为: 2.根据权利要求1所述的划分方法,其中,任意用户i,j之间的离散地理轨迹相似度表示为两者所有共同位置的余弦相似性指标之和: 3.根据权利要求2所述的划分方法,其中,步骤a具体为: 首先导入任意两个用户的历史基站序号列表,对比两者共同的基站数量以及占各自的比例,计算各自在所有共有基站位置I的出现概率Pu,然后计算对应的余弦相似性指标,最后求和得到任意两用户的离散地理轨迹相似度。4.根据权利要求1所述的划分方法,...

【专利技术属性】
技术研发人员:陈述涂来黄本雄马雪琴
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有1条评论
  • 来自[天津市电信IDC机房] 2015年03月08日 12:10
    2.[multitude]∶指平民、公众
    0
1