轨迹数据标注方法及装置制造方法及图纸

技术编号:11688751 阅读:124 留言:0更新日期:2015-07-07 22:18
本发明专利技术实施例提供一种轨迹数据标注方法及装置,该方法包括:通过公开数据源获取用户特征描述信息以及所述用户特征描述信息对应的第一信息点POI轨迹信息;根据所述第一POI轨迹信息获取第一POI类型轨迹数据;将所述第一POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息;根据所述第一POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对所述待标注POI类型轨迹数据对应的用户标注用户特征描述。本发明专利技术实施例中,实现了用户特征描述的自动标注,提高了标注的准确性和效率。

【技术实现步骤摘要】

本专利技术涉及通信技术,尤其涉及一种轨迹数据标注方法及装置
技术介绍
随着移动网络的爆炸式增长和移动智能设备的广泛应用,移动用户的轨迹数据成为一种重要的大数据来源,其中用户的轨迹数据又被称为用户时空分布数据。用户所使用的用户设备(User Equipment,简称UE)开着全球定位系统(Global Posit1n System,简称GPS)时,该UE在时空移动的信息就是使用该UE的用户的轨迹数据。用户通过UE使用移动网络时,基站记录的移动宽带(Mobile Broadband,简称MBB)数据中也含有大量用户的轨迹数据。这些轨迹数据的统计和深度挖掘带来了新的商业应用,例如:店铺选址、服务推荐、交通管理、地图修复等。现有技术中,获取用户的轨迹数据主要依靠数据工程师人工进行标注。但是,由于当前用户的数量巨大,采用现有技术,数据工程师的工作量完全无法满足当前的标注任务,也难以保证标注的效率和准确性。
技术实现思路
本专利技术提供一种轨迹数据标注方法及装置,用于解决现有技术人工标注轨迹效率低、准确性低的问题。本专利技术实施例第一方面提供一种轨迹数据标注方法,包括:通过公开数据源获取用户特征描述信息以及所述用户特征描述信息对应的第一信息点POI轨迹信息;根据所述第一 POI轨迹信息获取第一 POI类型轨迹数据;将所述第一 POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息;根据所述第一 POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对所述待标注POI类型轨迹数据对应的用户标注用户特征描述。结合第一方面,在第一方面的第一种可能的实施方式中,所述通过公开数据源获取用户特征描述信息以及所述用户特征描述信息对应的第一 POI轨迹信息,包括:在公开数据源上爬取用户签到数据;根据所述用户签到数据获取用户特征描述信息以及所述用户特征描述信息对应的第一 POI轨迹信息。结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述在公开数据源上爬取用户签到数据之后,还包括:根据所述签到数据中的POI列表获取第二 POI信息;根据所述第二 POI信息获取所述待标注类型轨迹数据。结合第一方面,在第一方面的第三种可能的实施方式中,将所述第一 POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息之后,还包括:将所述不同时间段对应的用户特征描述信息,按照不同的属性进行分类;根据所述第一 POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对所述待标注POI类型轨迹数据对应的用户标注用户特征描述,包括:根据所述第一 POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据信息中的时间信息,对所述待标注POI类型轨迹数据对应的用户按照不同的属性类型标注用户特征描述。本专利技术实施例第二方面提供一种轨迹数据标注装置,包括:获取模块,用于通过公开数据源获取用户特征描述信息以及所述用户特征描述信息对应的第一信息点POI轨迹信息;根据所述第一 POI轨迹信息获取第一 POI类型轨迹数据;处理模块,用于将所述第一 POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息;标注模块,用于根据所述第一 POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对所述待标注POI类型轨迹数据对应的用户标注用户特征描述。结合第二方面,在第二方面的第一种可能的实施方式中,所述获取模块,具体用于在公开数据源上爬取用户签到数据;根据所述用户签到数据获取用户特征描述信息以及所述用户特征描述信息对应的第一 POI轨迹信息。结合第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述获取模块,还用于根据所述签到数据中的POI列表获取第二POI信息;根据所述第二 POI信息获取所述待标注类型轨迹数据。结合第二方面,在第二方面的第三种可能的实施方式中,还包括:分类模块,用于在将所述第一 POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息之后,将所述不同时间段对应的用户特征描述信息,按照不同的属性进行分类;所述标注模块,具体用于根据所述第一 POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据信息中的时间信息,对所述待标注POI类型轨迹数据对应的用户按照不同的属性类型标注用户特征描述。本专利技术实施例中,通过公开数据源获取用户特征描述信息以及用户特征描述信息对应的第一信息点POI轨迹信息,根据第一 POI轨迹信息获取第一 POI类型轨迹数据,将所述第一 POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息,最后根据第一 POI类型轨迹和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对上述待标注POI类型轨迹数据对应的用户标注用户特征描述。实现了用户特征描述的自动标注,也提高了标注的准确性和效率。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的轨迹数据标注方法实施例一的流程示意图;图2为本专利技术提供的轨迹数据标注装置实施例一的结构示意图;图3为本专利技术提供的轨迹数据标注装置实施例二的结构示意图。【具体实施方式】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术提供的轨迹数据标注方法实施例一的流程示意图,如图1所示,该方法包括:S101、通过公开数据源获取用户特征描述信息以及上述用户特征描述信息对应的第一信息点(Point of Interest,简称POI)轨迹信息。公开数据源可以是一些公共的社交网络等,像微博、QQ空间、twitter、脸谱(facebook)等。用户特征描述信息中可以包括用户的属性,例如对应用户的性别、年龄、兴趣、职业等信息。第一 POI轨迹信息,是指已经存在对应的用户特征描述信息的POI轨迹信息,例如,某用户在他的微博上已经公开了他的性别、年龄、兴趣等信息,同时也根据该用户的签到信息获取了他的轨迹信息放在POI轨迹信息中。POI轨迹信息具体可以包括经纬度信息、类别信息等,其中类别信息是指描述该POI功能属性的信息,例如西餐厅、火车站、食堂、写当前第1页1 2 3 本文档来自技高网...
轨迹数据标注方法及装置

【技术保护点】
一种轨迹数据标注方法,其特征在于,包括:通过公开数据源获取用户特征描述信息以及所述用户特征描述信息对应的第一信息点POI轨迹信息;根据所述第一POI轨迹信息获取第一POI类型轨迹数据;将所述第一POI类型轨迹数据按预设时间段进行聚类,获取不同时间段对应的用户特征描述信息;根据所述第一POI类型轨迹数据和待标注POI类型轨迹数据的对应关系,以及待标注POI类型轨迹数据对应的时间信息,对所述待标注POI类型轨迹数据对应的用户标注用户特征描述。

【技术特征摘要】

【专利技术属性】
技术研发人员:袁明轩兰亮曾嘉
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1