当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于手机使用数据的个性化地点推荐方法技术

技术编号:22594653 阅读:88 留言:0更新日期:2019-11-20 11:04
本发明专利技术公开了一种基于手机使用数据的个性化地点推荐方法。首先对用户的地点访问记录数据进行预处理,获得候选地点及相应的地点标签;然后分别提取App使用、多媒体、通讯和网络、通话和短信、系统状态和运动状态等手机使用特征,用户的性别和年龄等人口统计学特征,以及平均停留时间和周末访问频率等地点特征;最后通过基于二阶因子分解机的推荐模型,为新用户预测候选地点的访问次数,从而实现个性化地点推荐。本发明专利技术利用手机使用数据进行个性化地点推荐,有效解决了用户冷启动问题,在路线规划和旅游景点推荐等基于位置的服务领域具有广阔的应用空间。

A personalized location recommendation method based on mobile phone usage data

The invention discloses a personalized location recommendation method based on mobile phone use data. First of all, preprocess the user's location access record data to obtain candidate locations and corresponding location tags; then extract the mobile phone usage features such as app usage, multimedia, communication and network, call and SMS, system status and movement status, demographic features such as user's gender and age, and location features such as average stay time and weekend access frequency; Finally, a recommendation model based on the second-order factorizer is used to predict the number of visits to candidate sites for new users, so as to realize personalized location recommendation. The invention uses mobile phone usage data to carry out personalized location recommendation, effectively solves the problem of user cold start, and has broad application space in the location-based service fields such as route planning and scenic spot recommendation.

【技术实现步骤摘要】
一种基于手机使用数据的个性化地点推荐方法
本专利技术涉及个性化地点推荐领域,具体涉及一种基于手机使用数据的个性化地点推荐方法。
技术介绍
随着移动互联网的迅猛发展,越来越多的用户热衷于在社交网络平台上分享他们去过的地点,并与其他用户交流互动。因此,挖掘用户的地点访问偏好进而向用户推荐其潜在感兴趣的地点成为了业界关注的热点,相应技术在路线规划和旅游景点推荐等基于位置的服务领域具有广阔的应用前景。根据在推荐过程中是否考虑用户个体偏好的差异,地点推荐可分为非个性化地点推荐和个性化地点推荐。非个性化地点推荐通常根据大众人群的喜好,基于全局的流行程度对地点进行排名,如获得当地过去一周的热门地点榜单直接向用户进行推荐。然而,这类方法忽视了用户个体差异可能产生的不同偏好,对每一个用户推荐的地点均是相同的,而大众人群的喜好并不一定适用于所有用户个体。个性化地点推荐考虑了用户个体差异所产生的不同偏好,以用户为中心,为每一个用户推荐其潜在感兴趣的、最相关的地点。这类方法通常利用基于位置的社交网络平台中的用户地点访问历史数据(如签到数据)来挖掘不同用户的地点访问偏好,进而实现个性化地点推荐。然而,这类方法不可避免地会存在用户冷启动问题。由于新用户没有任何地点访问历史数据,难以挖掘其地点访问偏好,因此这类方法对于新用户无法工作。针对这一问题,现有方法尝试引入其它外部信息(如用户的人口统计学信息)来刻画用户。然而,由于缺乏丰富的细粒度用户信息,这类方法难以取得良好的个性化推荐效果。此外,随着智能手机的广泛普及,用户在日常使用手机的过程中产生了大量的日志数据,包括App使用、无线网络信号、通话和短信、系统设置和加速度传感器数据等。这些丰富的手机使用数据包含用户的地点访问历史和日常手机使用习惯信息,体现了不同用户的行为特点。然而,现有方法忽略了这一足以充分刻画用户的重要信息。
技术实现思路
本专利技术要解决的技术问题是如何有效利用手机使用数据,挖掘用户地点访问偏好,提出一种基于手机使用数据的个性化地点推荐方法。本专利技术的技术方案为:一种基于手机使用数据的个性化地点推荐方法,包括候选地点推荐模型构建阶段和个性化地点推荐阶段,其中:候选地点推荐模型构建阶段包括:步骤1-1,输入所有用户的基本信息和地点访问记录集合;步骤1-2,利用DBSCAN算法分别对每一个用户的所有地点访问记录数据进行聚类,获得每一个用户访问的地点集合,并确定用户的“家”和“工作场所或学校”个性化语义标签;步骤1-3,利用DBSCAN算法对所有用户访问的地点进行聚类,发现不同用户共同访问的公共地点,生成候选地点集合并确定每个候选地点的非个性化语义标签;步骤1-4,提取用户的手机使用特征fphone,具体包括提取App使用特征fa、多媒体特征fm、通讯和网络特征fn、通话和短信特征fc、系统状态特征fs和运动状态特征fo;步骤1-5,提取用户的人口统计学特征fuser,具体包括提取用户的性别特征fg、年龄特征fe、工作状况特征fw和收入特征fi;步骤1-6,提取地点特征flocation,具体包括提取地点的标签特征fl、平均停留时间特征ft、周末访问频率特征fr和分段访问频率特征ff;步骤1-7,根据手机使用特征fphone、人口统计学特征fuser以及地点特征flocation构建用户及其历史所访问的每一个地点的特征向量xpos,并统计相应地点的访问次数ypos,根据特征向量xpos和对应的访问次数ypos构建正样本训练数据集Dpos;步骤1-8,从每个用户的未访问地点中随机采样s个地点作为用户的负样本,构造用户和每一个负样本地点的特征向量xneg,并将相应地点的访问次数yneg置为0,根据特征向量xneg和访问次数yneg构建负样本训练数据集Dneg;步骤1-9,利用二阶因子分解机构建候选地点推荐模型,将正样本训练数据集Dpos和负样本训练数据集Dneg输入候选地点推荐模型中进行训练,获得训练好的候选地点推荐模型;个性化地点推荐阶段包括:步骤2-1,同步骤1-4和步骤1-5,提取新用户的手机使用特征f′phone和人口统计学特征f′user;步骤2-2,为新用户和每一个候选地点构造相应的特征向量xtest;步骤2-3,将步骤2-2中的特征向量xtest输入训练好的基于二阶因子分解机的候选地点推荐模型,预测每一个候选地点的访问次数ytest;步骤2-4,对步骤2-3中的候选地点的访问次数预测结果ytest进行降序排序,为新用户推荐排序列表中的前N个地点。本专利技术利用用户的手机使用数据来挖掘用户地点访问偏好,实现个性化地点推荐。与现有方法相比,其优点在于:1)提出基于手机使用数据的个性化地点推荐方法,引入大量的用户手机使用数据来刻画用户,解决了用户冷启动问题。2)利用用户手机使用数据提取App使用、多媒体、通讯和网络、通话和短信、系统状态和运动状态等六类手机使用特征,充分挖掘用户的地点访问偏好。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。图1是基于手机使用数据的个性化地点推荐方法的流程图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。如图1所示,本实施例提供的基于手机使用数据的个性化地点推荐方法,包括两个阶段,分别为候选地点推荐模型构建阶段和个性化地点推荐阶段。候选地点推荐模型构建阶段本阶段主要构建候选地点推荐模型,具体包括以下步骤:步骤1-1,输入所有用户的基本信息和地点访问记录集合。每个用户的基本信息包含性别、年龄、工作状况和平均月收入等人口统计学数据。每条地点访问记录可表示为vt=(u,llon,llat,tsta,tend,ue),其中u表示用户,llon和llat表示地点的经纬度坐标,tsta和tend表示地点访问的开始时间和结束时间,ue为在地点访问期间从用户手机上获取的各类手机使用数据,包括App使用,音乐、视频和照片等多媒体资源,蓝牙、无线网络和蜂窝网络信号,通话和短信记录,手机电量、内存容量、情景模式和响铃模式等系统状态,以及加速度传感器所反映的用户运动状态等信息。步骤1-2,利用DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)算法分别对每一个用户的所有地点访问记录数据进行聚类,获得每一个用户访问的地点集合,并确定用户的“家”和“工作场所或学校”等个性化语义标签。针对每一个用本文档来自技高网
...

【技术保护点】
1.一种基于手机使用数据的个性化地点推荐方法,包括候选地点推荐模型构建阶段和个性化地点推荐阶段,其中:/n候选地点推荐模型构建阶段包括:/n步骤1-1,输入所有用户的基本信息和地点访问记录集合;/n步骤1-2,利用DBSCAN算法分别对每一个用户的所有地点访问记录数据进行聚类,获得每一个用户访问的地点集合,并确定用户的“家”和“工作场所或学校”个性化语义标签;/n步骤1-3,利用DBSCAN算法对所有用户访问的地点进行聚类,发现不同用户共同访问的公共地点,生成候选地点集合并确定每个候选地点的非个性化语义标签;/n步骤1-4,提取用户的手机使用特征f

【技术特征摘要】
1.一种基于手机使用数据的个性化地点推荐方法,包括候选地点推荐模型构建阶段和个性化地点推荐阶段,其中:
候选地点推荐模型构建阶段包括:
步骤1-1,输入所有用户的基本信息和地点访问记录集合;
步骤1-2,利用DBSCAN算法分别对每一个用户的所有地点访问记录数据进行聚类,获得每一个用户访问的地点集合,并确定用户的“家”和“工作场所或学校”个性化语义标签;
步骤1-3,利用DBSCAN算法对所有用户访问的地点进行聚类,发现不同用户共同访问的公共地点,生成候选地点集合并确定每个候选地点的非个性化语义标签;
步骤1-4,提取用户的手机使用特征fphone,具体包括提取App使用特征fa、多媒体特征fm、通讯和网络特征fn、通话和短信特征fc、系统状态特征fs和运动状态特征fo;
步骤1-5,提取用户的人口统计学特征fuser,具体包括提取用户的性别特征fg、年龄特征fe、工作状况特征fw和收入特征fi;
步骤1-6,提取地点特征flocation,具体包括提取地点的标签特征fl、平均停留时间特征ft、周末访问频率特征fr和分段访问频率特征ff;
步骤1-7,根据手机使用特征fphone、人口统计学特征fuser以及地点特征f1ocation构建用户及其历史所访问的每一个地点的特征向量xpos,并统计相应地点的访问次数ypos,根据特征向量xpos和对应的访问次数ypos构建正样本训练数据集Dpos;
步骤1-8,从每个用户的未访问地点中随机采样s个地点作为用户的负样本,构造用户和每一个负样本地点的特征向量xneg,并将相应地点的访问次数yneg置为0,根据特征向量xneg和访问次数yneg构建负样本训练数据集Dneg;
步骤1-9,利用二阶因子分解机构建候选地点推荐模型,将正样本训练数据集Dpos和负样本训练数据集Dneg输入候选地点推荐模型中进行训练,获得训练好的候选地点推荐模型;
个性化地点推荐阶段包括:
步骤2-1,同步骤1-4和步骤1-5,提取新用户的手机使用特征f′phone和人口统计学特征f′user;
步骤2-2,为新用户和每一个候选地点构造相应的特征向量xtest;
步骤2-3,将步骤2-2中的特征向量xtest输入训练好的基于二阶因子分解机的候选地点推荐模型,预测每一个候选地点的访问次数ytest;
步骤2-4,对步骤2-3中的候选地点的访问次数预测结果ytest进行降序排序,为新用户推荐排序列表中的前N个地点。


2.如权利要求1所述的基于手机使用数据的个性化地点推荐方法,其特征在于,步骤1-2中,针对每一个用户的所有地点访问记录,分别利用DBSCAN算法进行聚类,将聚类结果得到的每一个簇内的地点视为同一地点,获得每一个用户访问的地点集合,然后,根据用户地点访问的时间特性,从每一个用户访问的地点集合中确定个性化语义标签,即“家”和“工作场所或学校”。


3.如权利要求1所述的基于手机使用数据的个性化地点推荐方法,其特征在于,步骤1-3中,
首先,对每一个用户访问的地点集合中的“家”和“工作场所或学校”两个地点进行过滤;
然后,用DBSCAN算法对其余所有地点进行聚类,将聚类结果得到的每一个簇内,不同用户访问的地点视为同一地点,即不同用户共同访问的公共地点,该公共地点组成候选地点集合;
最后,将每个候选地点的经纬度坐标与在线地图服务中的兴趣点(POI)语义标签一一对齐,从而获得每个候选地点的非个性化语义标签,具体包括:交通相关场所、室外运动场所、室内运动场所、餐馆或酒吧、商场或购物中心和旅游景点。


4.如权利要求1所述的基于手机使用数据的个性化地点推荐方法,其特征在于,步骤1-4具体包括:
a)提取用户的App使用特征fa:首先,统计在所有用户中使用频率最高的50个App并按k=1,2,...,50进行编号;然后,统计用户在每一次地点访问记录中上述50个App的使用次数,所有手机App启动次数nstarted和关闭次数nclosed;最后,对上述统计特征归一化并按不同地点标签归类,对用户在同一地点标签的特征均值化处理,并将不同地点标签的特征进行拼接得到最终用户的App使用特征fa;
b)提取用户的多媒体特征fm:首先,统计用户在每一次地点访问记录中,手机上音乐、视频和照片的使用情况,具体包括:播放音乐数nmusic、播放音乐总时长tmusic_tot、平均播放时长tmusic_ave、最短播放时长tmusic_min和最长播放时长tmusic_max,以及播放视频的平均大小smp4_ave和浏览照片的平均大小sjpg_ave;其次,对上述统计特征归一化并按不同地点标签归类,对用户在同一...

【专利技术属性】
技术研发人员:陈岭施鸿裕
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1