当前位置: 首页 > 专利查询>复旦大学专利>正文

一种自动推断社会关系的移动用户位置预测方法与装置制造方法及图纸

技术编号:19152827 阅读:28 留言:0更新日期:2018-10-13 10:52
本发明专利技术属于移动行为预测技术领域,具体为一种自动推断社会关系的移动用户位置预测方法与装置。本发明专利技术包括:从用户移动行为日志数据库中获取用户的个体行为记录;据此推断用户间社会关系类型;以用户为节点、两用户间的社会关系类型为连边,构建用户社会关系网络;利用所述用户个体行为记录,构建用户按时间顺序的离散移动轨迹序列;利用杰卡德系数生成社会关系子图,构建零模型,比较各社会关系子图在真实网络和零模型下统计指标值的大小关系,确定用户群体社会关系模体;进行用户个体社会关系模体验证;分别建立马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器,用于预测该用户的未来位置。本发明专利技术可提高位置预测的准确性,保护用户的个人隐私。

A mobile user location prediction method and device for automatically inferring social relations

The invention belongs to the technical field of mobile behavior prediction, in particular to a mobile user position prediction method and device for automatically inferring social relations. The invention comprises: acquiring user's individual behavior records from the user's mobile behavior log database; inferring the type of social relationship among users; constructing a user's social relationship network with the user as a node and the type of social relationship between two users as a connecting edge; and constructing a user's chronological order by using the user's individual behavior records. Sequence of discrete moving trajectory; Generate social relation subgraph with Jaccard coefficient, construct zero model, compare the relationship between the social relation subgraph and the statistical index value under real network and zero model, determine the user group social relation model; carry out user individual social relation model verification; set up Markov model respectively; Predictors, acquaintance predictors, familiar stranger predictors, and output regulators are used to predict the future position of the user. The invention can improve the accuracy of location prediction and protect users' privacy.

【技术实现步骤摘要】
一种自动推断社会关系的移动用户位置预测方法与装置
本专利技术属于移动行为预测
,具体涉及一种自动推断社会关系的移动用户位置预测方法与装置。
技术介绍
近些年来,大规模人类行为轨迹数据的产生与采集促使学术界迸发出了一大批刻画人类移动模式的创新研究。有关人类移动的实证分析和模型研究为人类生活中不同领域的实际应用场景发挥了巨大的作用,例如位置预测、疾病预防和控制、交通出行规划、数据共享以及灾害应对等等。作为极其重要的应用之一,预测用户未来位置的课题称为学术界和工业界的研究热点。目前,有关用户位置预测的方法主要可以分为两大类:一类为基于用户自身历史移动轨迹的方法,另一类则为结合用户社会关系的方法。早些年研究者们根据用户自身的历史移动轨迹信息设计了一系列预测方法,其中最具有代表性的一种方法为基于马尔可夫链的预测方法。2006年Song等人发表在《IEEETransactionsonMobileComputing》上的《EvaluatingNext-CellPredictorswithExtensiveWi-FiMobilityData》以及2013年Lu等人发表在《ScientificReports》上的《ApproachingtheLimitofPredictabilityinHumanMobility》等工作介绍了基于不同阶数马尔可夫链的预测方法,文章通过分析发现相比复杂的高阶马尔可夫预测方法,简单的低阶(一阶或二阶)马尔可夫预测方法可以达到较好的预测准确率。该类型方法的优势在于实现比较简单,但预测准确率仍有待提升。随着社交网络的社交网络、无线通信和移动计算等领域在近些年的飞速发展,研究者们逐步将用户在社交网络上的社会关系利用到位置预测方法的设计中来。2015年Zhang等人在《IEEETransactionsonComputers》上的《NextCell:PredictingLocationUsingSocialInterplayfromCellPhoneTraces》以及2016年Jia等人在《ACMTransactionsonIntelligentSystemsandTechnology》上发表的《LocationPrediction:ATemporal-SpatialBayesianModel》等工作利用用户的朋友等社会关系的移动轨迹来预测该用户的未来位置。纵观这类方法,它们的共性在于利用了用户的朋友、同事/同学等熟人社会关系来为用户的位置预测服务,因此相比第一类方法,这类方法在预测准确率上有着比较明显的提升。然而,在现有的预测方法研究中仍然存在着问题,即对用户社会关系考虑的不全面。现有的利用用户社会关系的预测方法主要考虑了从社交网站上的链接关系、手机通话及短信记录、手机通讯录记录等采集到的用户的朋友、熟人等这类熟人社会关系。而事实上,一方面,社交网络的发展使得用户越来越多的信息暴露在社交网络中,敏感信息暴露在开放的社交网络中所导致的多种隐私信息泄露问题逐渐引起人们对于隐私保护议题的关注,这使得科研工作者们在获取用户社会关系数据方面面临着越来越多的困难和挑战;另一方面,除了这些我们能够直观感受到的紧密社会关系,在我们的日常生活中还存在着一类特殊的社会关系,即“熟悉的陌生人”。熟悉的陌生人是这样的一群人,他们会重复地相遇,但他们却彼此不相识也从未注意到对方,例如在每天上班的公交车上,在每周去的健身馆里,都有可能遇到很多这样熟悉的陌生人,它占据了人们日常所能接触到的人的很大一部分,因而不能被忽略。2016年Liang等人在《EurophysicsLetters》上发表的《IdentifyingFamiliarStrangersinHumanEncounterNetworks》一文设计了熟悉的陌生人分类器用以从不同的社会关系中挖掘出熟悉的陌生人关系。迄今为止,尚未见到将该类社会关系应用到位置预测领域的相关研究工作。
技术实现思路
本专利技术目的在于提供了一种自动推断社会关系的移动用户位置预测方法与装置,以解决现有位置预测方法中需要采集用户的社会关系数据和对用户社会关系考虑不足的问题,从而保护用户的个人隐私,提高位置预测方法的准确性。本专利技术提供的自动推断社会关系的移动用户位置预测方法,具体步骤为:(1)获取用户个体行为记录,即从用户移动行为日志数据库中,获取用户的个体行为记录,每条数据记录包括:用户ID、接入起始时间、接入持续时间、接入地点ID;(2)推断用户间社会关系类型,即利用所述用户个体行为记录推断两用户间的社会关系类型,社会关系类型包括熟悉的陌生人FS(familiarstranger)、熟人F&IR(包括朋友friend和同事in-role)、陌生人S(stranger);(3)建立用户社会关系网络,即以用户为节点,两用户间的社会关系类型为连边(不考虑陌生人关系),构建用户社会关系网络;(4)建立用户移动轨迹序列,即利用所述用户个体行为记录,构建用户按时间顺序的离散移动轨迹序列;(5)检测用户群体社会关系模体,即利用杰卡德系数生成社会关系子图;通过度保留断边重连的方法生成随机化用户社会关系网络,构建零模型;比较各社会关系子图在真实网络和零模型下统计指标z值的大小关系,确定用户群体社会关系模体;(6)用户个体社会关系模体验证,首先利用杰卡德系数生成该用户的社会关系子图;比较该用户个体社会关系子图是否为前述社会关系模体,若是则通过验证,反之则不通过;(7)建立位置预测器,即分别建立马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器;若该个体通过社会关系模体验证,则只需利用马尔可夫预测器、熟悉的陌生人预测器和输出调节器来预测该用户的未来位置,若未通过验证,则需要马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器预测该用户的未来位置。本专利技术步骤(1)中,所述从用户移动行为日志数据库中,获取用户的个体行为记录,每条记录包括:用户ID、时间、地点、停留时间。本专利技术步骤(2)中,所述利用用户个体行为记录推断两用户间的社会关系类型,详见中国专利“一种基于用户移动行为的线下社会关系分类方法及装置”(专利号201611264316.7),包括:根据用户行为记录,得到用户集U,地点集L。每条数据记录包括用户ID、接入起始时间、接入持续时间、接入地点ID;根据用户行为记录中的时间数据,确定用户行为周期T,离散化时间步长度ΔT,其中,所述用户行为周期T将日志数据中的整个时间轴划分为N个周期;对于每一个周期n,构建用户u的行为矩阵其中,u为用户集U中的第u个用户,n为N个周期中的第n个周期,l表示地点集L中的第l个地点;行为矩阵Sn(u)中的元素为0或1。用时间空间共现表示用户u与用户v在同一个地点l拥有时间重合的行为记录。时空共现代表用户u与用户v在实际生活中的一次“交互事件”。定义En为第n个周期内的所有交互事件的集合,如果用户u与用户v在第n个周期,地点l,时间步t有一次时间空间共现,则交互事件en=(u,v,t,l)∈En。对于每一对拥有至少一次交互事件的用户对(u,v),构建交互矩阵其中,u为用户集U中的第u个用户,v为用户集U中的第v个用户,l表示地点集L中的第l个地点。交互矩阵M本文档来自技高网
...

【技术保护点】
1.一种自动推断社会关系的移动用户位置预测方法,其特征在于,具体步骤为:(1)获取用户个体行为记录,即从用户移动行为日志数据库中,获取用户的个体行为记录,每条数据记录包括用户ID、接入起始时间、接入持续时间、接入地点ID;(2)推断用户间社会关系类型,即利用所述用户个体行为记录推断两用户间的社会关系类型,包括熟悉的陌生人FS、熟人F&IR、陌生人S,熟人F&IR包括朋友friend和同事in‑role;(3)建立用户社会关系网络,即以用户为节点,除陌生人关系外,两用户间的社会关系类型为连边,构建用户社会关系网络;(4)建立用户移动轨迹序列,即利用所述用户个体行为记录,构建用户按时间顺序的离散移动轨迹序列;(5)检测用户群体社会关系模体,即利用杰卡德系数生成社会关系子图;通过度保留断边重连的方法生成随机化用户社会关系网络,构建零模型;比较各社会关系子图在真实网络和零模型下统计指标z值的大小关系,确定用户群体社会关系模体;(6)用户个体社会关系模体验证,首先利用杰卡德系数生成该用户的社会关系子图;比较该用户个体社会关系子图是否为前述社会关系模体,若是则通过验证,反之则不通过;(7)建立位置预测器,即分别建立马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器;若该个体通过社会关系模体验证,则只需利用马尔可夫预测器、熟悉的陌生人预测器和输出调节器来预测该用户的未来位置,若未通过验证,则需要马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器预测该用户的未来位置。...

【技术特征摘要】
1.一种自动推断社会关系的移动用户位置预测方法,其特征在于,具体步骤为:(1)获取用户个体行为记录,即从用户移动行为日志数据库中,获取用户的个体行为记录,每条数据记录包括用户ID、接入起始时间、接入持续时间、接入地点ID;(2)推断用户间社会关系类型,即利用所述用户个体行为记录推断两用户间的社会关系类型,包括熟悉的陌生人FS、熟人F&IR、陌生人S,熟人F&IR包括朋友friend和同事in-role;(3)建立用户社会关系网络,即以用户为节点,除陌生人关系外,两用户间的社会关系类型为连边,构建用户社会关系网络;(4)建立用户移动轨迹序列,即利用所述用户个体行为记录,构建用户按时间顺序的离散移动轨迹序列;(5)检测用户群体社会关系模体,即利用杰卡德系数生成社会关系子图;通过度保留断边重连的方法生成随机化用户社会关系网络,构建零模型;比较各社会关系子图在真实网络和零模型下统计指标z值的大小关系,确定用户群体社会关系模体;(6)用户个体社会关系模体验证,首先利用杰卡德系数生成该用户的社会关系子图;比较该用户个体社会关系子图是否为前述社会关系模体,若是则通过验证,反之则不通过;(7)建立位置预测器,即分别建立马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器;若该个体通过社会关系模体验证,则只需利用马尔可夫预测器、熟悉的陌生人预测器和输出调节器来预测该用户的未来位置,若未通过验证,则需要马尔可夫预测器、熟人预测器、熟悉的陌生人预测器和输出调节器预测该用户的未来位置。2.根据权利要求1所述的预测方法,其特征在于,步骤(2)中,所述利用用户个体行为记录推断两用户间的社会关系类型,具体流程为:根据用户行为记录,得到用户集U,地点集L,每条数据记录包括用户ID、接入起始时间、接入持续时间、接入地点ID;根据用户行为记录中的时间数据,确定用户行为周期T,离散化时间步长度ΔT,其中,所述用户行为周期T将日志数据中的整个时间轴划分为N个周期;对于每一个周期n,构建用户u的行为矩阵其中,u为用户集U中的第u个用户,n为N个周期中的第n个周期,l表示地点集L中的第l个地点;行为矩阵Sn(u)中的元素为0或1;用时间空间共现表示用户u与用户v在同一个地点l拥有时间重合的行为记录;时空共现代表用户u与用户v在实际生活中的一次“交互事件”;定义En为第n个周期内的所有交互事件的集合,如果用户u与用户v在第n个周期,地点l,时间步t有一次时间空间共现,则交互事件en=(u,v,t,l)∈En;对于每一对拥有至少一次交互事件的用户对(u,v),构建交互矩阵其中,u为用户集U中的第u个用户,v为用户集U中的第v个用户,l表示地点集L中的第l个地点;交互矩阵Mu,v的元素为一个二元组表示交互权重,表示交互支持度,其中,和通过如下式(1)、(2)计算:通过如下式(3)计算用户时空交互矩阵的规律度dr(u,v):通过如下式(4)计算用户时空交互矩阵的时空熵de(u,v):构建零假设:用户个体行为不受他人的影响,用户个体行为不具有周期偏向性;根据零假设,建立用户个体行为和用户间时空交互矩阵的零模型,即每个周期内的随机用户行为矩阵和随机时空交互矩阵;根据所述用户行为矩阵计算个体活跃度;用户活跃度表示用户在一个周期内访问一个时空栅格的概率;根据用户行为矩阵建立用户-时空栅格二部图;所述用户-时空栅格二部分图包括:所述用户集中表示每个用户的节点,表示每个时空栅格(t,l)的节点以及存在行为记录的用户和时空栅格之间的连边;用户行为矩阵中的元素时,用户u与时空栅格(t,l)存在连边;利用保留度的连边交换法随机化用户-时空栅格二部图,得到随机用户-时空栅格二部图;这里保留每个节点的度不变,节点和连边的数量不变;根据所述个体活跃度与所述随机用户-时空栅格二部图,重建每个周期内的所述用户个体行为矩阵和用户间时空交互矩阵的零模型,包括:随机用户行为矩阵随机时空交互矩阵随机规律度和随机时空熵统计零模型中时空熵与规律度的概率分布,并通过预置概率p0确定时空熵和规律度的零阈值,包括:预置概率p0,其中p0远小于1;根据所述零模型中时空熵与规律度的概率分布,确定时空熵零阈值e0和规律度零阈值r0;其中所述时空熵零阈值e0满足所述规律度零阈值r0满足通过比较真实用户交互矩阵的在时空熵和规律度两个维度上与其零阈值之间的大小关系,确定两用户间的线下社会关系:熟悉的陌生人FS,熟人F&IR,陌生人S,包括:若用户交互矩阵的时空熵小于时空熵随机阈值,规律度大于规律度随机阈值,则确定用户间线下社会关系为熟悉的陌生人;若用户交互矩阵的时空熵小于时空熵随机阈值,规律度大于规律度随机阈值,则确定用户间线下社会关系为熟悉的陌生人FS;若用户交互矩阵的时空熵大于时空熵随机阈值,则确定用户间线下社会关系为熟人关系F&IR;其中,若规律度大于规律度随机阈值,则确定用户间线下社会关系为熟人关系中的同事或同学职业关系IR,若规律度小于规律度随机阈值,则确定用户间线下社会关系为熟人关系中的朋友关系F。3.根据权利要求2所述的预测方法,其特征在于,步骤(3)中所述构建用户社会关系网络,包括:每一个用户u作为节点,两用户间的社会关系类型作为连边e,若两用户间的社会关系类型为熟人或熟悉的陌生人关系,则认为该两用户间存在一条连边,连边类型对应社会关系的类型,由此构建用户社会关系网络G=(U,ε),其中U为用户集合,ε为连边集合。4.根据权利要求3所述的预测方法,其特征在于,步骤(4)中所述利用用户个体行为记录,构建用户按时间顺序的离散移动轨迹序列,包括:根据用户行为中的时间数据,确定离散化时间步长度ΔT;对于用户的行为记录,若用户在一个离散化时间步内存在多条记录,则选取访问持续时间最长或访问次数最多的地点作为该离散化时间步的地点,由此构建用户的离散移动轨迹序列。5.根据权利要求4所述的预测方法,其特征在于,步骤(5)中所述利用杰卡德系数生成社会关系子图,包括:定义Γ(u)和Γ(v)分别为用户u和v的熟人关系邻居集合,通过如下方式计算每个用户与其所有社会关系的杰卡德系数J:定义用户的n阶社会关系子图为被预测用户的前n个最重要的社会关系个体类型;将每个用户的社会关系按杰卡德系数从大到小排序取前n个个体由此得到每个用户的n阶社会关系子图。6.根据权利要求5所述的预测方法,其特征在于,步骤(5)中所述通过度保留断边重连的方法生成随机化用户社会关系网络,构建零模型,包括:给定一个实际社会关系网络G=(U,ε),对于社会关系连边集合ε中的一条连边est,随机选择一条相同社会关系类型的连边;即对于连边则随机选择另一条连边以概率将两条连边(u,v,FS)和(u′,v′,FS)替换为(u,v′,FS)和(u′,v,FS),否则将它们替换为(u,u′,FS)和(v,v′,FS);若该断边重连的过程产生了自环边或重边,则终止该次断边重连操作;重复以上过程直至所有连边已被重连过,则获得一个随机社会关系网络;生成如上的100个随机社会关系网络作为零模型。7.根据权利要求6所述的预测方法,其特征在于,步骤(5)中所述比较各社会关系子图...

【专利技术属性】
技术研发人员:李翔张澍民李聪
申请(专利权)人:复旦大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1