一种基于表征学习的用户生活模式识别方法技术

技术编号：27437151 阅读：18 留言：0更新日期：2021-02-25 03:29

本发明专利技术的一种基于表征学习的用户生活模式识别方法包括：第一步，特征选取步骤；首先将从原始轨迹数据中提取签到兴趣点类别转移序列。其次，签到兴趣点类别转移序列进入预处理层，输出每个用户的生活模式初级表征。第二步，表征学习步骤；利用word2vec CBOW表征学习方法学习用户的向量表征，同时保留用户移动的语义和时间信息。第三步，模块识别步骤；通过经典的聚类方法对生活模式进行聚类。通过分析用户移动数据，从具有丰富语义的时空数据中识别基于语义的用户时空行为模式，理解支配用户移动时空行为的根本原因，即用户的生活模式。理解用户的生活模式有助于理解人们的社会经济状况，了解社会资本在城市中的分布。该模型可用于推断职住分布、职业情况等。职业情况等。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于表征学习的用户生活模式识别方法

[0001]本专利技术属于移动数据分析领域，通过分析用户位置数据，从具有丰富语义的时空数据中识别基于语义的用户时空行为模式，理解支配用户移动时空行为的根本原因，即用户的生活模式。具体涉及一种基于表征学习的用户生活模式识别方法。

技术介绍

[0002]用户语义空间中的时空行为单元为时间片+行为，例如早上九点在办公室办公、中午12点在快餐店用餐均属于单元。如果一群人，在一天中的不同时间段有相同的时空语义行为，则这群人具有相同的生活模式，他们在移动的目的/语义层级上具有相似性，这种时空模式，不受物理空间的制约，较通常研究中的轨迹模式，更加深刻地展现出用户的基本属性，如职业、经济状况等。研究一种有效快速的算法，能够无监督地通过具有兴趣点签到信息的用户移动数据，有效耦合时间信息与行为信息（签到兴趣点类别），聚类得到用户典型的语义空间时空行为模式，理解用户的生活模式，并通过识别得到的时空行为模式，不同模式在城市中的分布，从而对于城市的人口职业分布与经济发展状况做出更可靠、更具时效的评估。
[0003]然而，从用户移动数据中识别典型生活模式具有很大的挑战性。主要需要解决的技术问题有以下几个方面，第一，没有从变长的签到记录中获取用户行为特征的现成方法，第二，签到兴趣点类别精度的选取十分困难，低精度的类别无法很好地表征用户习惯，高精度的类别则数量巨大，且类别之间存在不同程度的相似性，如“中餐”与“快餐”的相关性要远大于“中餐”与“工厂”，第三，定义用户间生活模式行为的相似性十分困难，因为...

【技术保护点】

【技术特征摘要】
1.一种基于表征学习的用户生活模式识别方法，其特征在于，包括以下步骤，第一步，特征选取步骤；首先将从原始轨迹数据中提取签到兴趣点类别转移序列；其次，签到兴趣点类别转移序列进入预处理层，输出每个用户的生活模式初级表征；第二步，表征学习步骤；利用word2vec CBOW表征学习方法学习用户的向量表征，同时保留用户移动的语义和时间信息；第三步，模块识别步骤；通过经典的聚类方法对生活模式进行聚类。2.根据权利要求1所述的一种基于表征学习的用户生活模式识别方法，其特征在于：所述的特征选取步骤包括以下步骤，S1：将轨迹中的GPS信息与行为信息分离，将行为信息和离散化的时间片作为表征学习的基本单元，所述的行为信息是兴趣点签到类别；S2：通过特征选取模块，获得每个用户具有代表性的周中与周末用户时空行为序列；而后，用户行为特征序列进入表征学习模块，该模块定义窗口宽度w，利用某一行为单元附近的状态学习行为单元的向量表征。3.根据权利要求1所述的一种基于表征学习的用户生活模式识别方法，其特征在于：所述的表征学习步骤包括以下步骤，S3：利用word2vec CBOW模型，首先随机初始化各单元向量的值，而后对某一基本单元窗口宽度内邻单元向量求和，并试图通过神经网络预测该行为单元；利用梯度下降法经过多轮训练后，神经网络可以较为准确地通过邻居向量重构目标单元，因此中间层权值即可作为状态的...

【专利技术属性】
技术研发人员：朱悦，戴吉秋，高兆庆，张宸瑞，路国平，
申请(专利权)人：北京智数时空科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人