一种基于智能手机流量数据的用户基础属性预测方法技术

技术编号:11404663 阅读:71 留言:0更新日期:2015-05-03 20:43
本发明专利技术通过分析用户智能手机的流量数据,预测用户的年龄和性别等基础属性。获取智能手机上所有APP的流量精确使用情况,分析用户对每个APP流量的使用特征,并计算相应特征值。将所有APP的流量特征值作为特征向量,通过用户ID将用户的基础属性和特征向量关联起来,分析智能手机流量数据与用户基础属性之间的关系,从而达到依据智能手机的流量数据预测用户的基础属性的目的。采用SVM模型实现对用户的基础属性的分类预测。本发明专利技术将用户的性别作为男和女的二分类问题处理,年龄分段之后作为多分类问题处理。本发明专利技术实施例的有益效果是,通过分析用户智能手机的流量数据可以对用户的性别、年龄等基础属性做出预测,经过实验能够获得有效的预测效果。

【技术实现步骤摘要】
一种基于智能手机流量数据的用户基础属性预测方法
本专利技术涉及移动互联网技术,具体涉及一种基于智能手机流量数据的用户基础属性预测方法的实现方法。
技术介绍
随着web2.0的到来和移动互联网的飞速发展,用户的基础属性在网络应用中扮演的角色越来越重要,例如:Google提供的个性化搜索服务(是根据用户的地理位置信息和用户的搜索历史记录为用户返回个性化的搜索列表,给用户提供个性化的搜索服务)。用户基础属性预测就是通过分析用户的浏览行为和搜索内容来预测用户的年龄、性别、收入状况、地理位置、文化程度、宗教信仰等基础属性。对用户基础属性预测的研究主要集中在用户的网络日志和用户的搜索内容上。对用户的网络日志的研究主要是通过研究用户网络日志的书写习惯和用语习惯预测作者的性别和年龄,采取的方法主要是基于文本的分类方法。对用户的搜索内容研究主要是分析用户的搜索内容和用户的基础属性之间的联系,以实现对用户的基础属性预测目的,采取的方法一般是统计分析和关联规则分析。然而,随着移动互联网的飞速发展,基于移动终端的对用户基础属性的预测也越来越重要。
技术实现思路
本专利技术的目的是提供基于智能手机流量数据的用户基础属性预测方法的实现方法。使用本专利技术提供的实施例,可以通过分析用户智能手机的流量数据对用户的基础属性进行预测。本专利技术通过分析用户智能手机的流量数据,预测用户的年龄和性别等基础属性。从用户智能手机安装的所有APP(Application)出发,根据智能手机操作系统提供的API(ApplicationProgrammingInterface),获取所有APP流量的精确使用情况,包括记录每个APP每次产生的流量及其时间。同时实时监测手机屏幕的状态(开屏或锁屏),若处于锁屏状态,则不记录;若处于开屏状态,则记录当前手机前台所运行的APP名称,并按开屏产生流量和锁屏产生流量,分别计算出用户对每个APP流量的使用特征。由于不同属性的用户对同一APP具有不同的使用特征,同一属性的用户对不同APP具有不同的使用特征,且同一属性的用户对同一APP具有类似的使用特征,故本专利技术以此为依据来预测用户的基础属性。具体计算过程如下:分别计算各APP每次从产生流量到下一次使用该APP(手机屏幕处于开屏状态且该APP处于前台)的时间间隔,每个APP得到一组时间间隔,提取每一组时间间隔的特征值。将用户智能手机所有APP的特征值作为特征向量,通过用户ID(Identity)将用户的基础属性和用户智能手机得到的特征向量关联起来,分析用户智能手机流量数据与用户基础属性之间的关系,从而达到依据用户智能手机的流量数据预测用户的基础属性的目的。采用SVM(SupportVectorMachine)模型实现对用户的基础属性的分类预测。本专利技术将用户的性别作为男和女的二分类问题处理,年龄分段之后作为多分类问题处理。该方法的步骤包括:1、使用智能手机操作系统提供的API,记录智能手机一段时间里使用流量的详细情况;2、根据用户在这一段时间里智能手机的使用情况,计算各APP从每次产生流量到下一次该APP被使用的时间间隔,按APP名称将其分组,每个APP分别对应一组时间间隔;3、对各组时间间隔统计分析,计算并提取其特征值。一组时间间隔提取m个特征值,构成特征向量(特征值1,特征值2,…,特征值m)1×m,用户使用n个APP,可得到向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)1×(mn+1);4、将向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)转化为用户的特征值矩阵R;5、通过关键字用户ID,将用户的特征值矩阵和用户的基础属性关联,将用户的基础属性设置为类标;6、用训练数据训练SVM分类模型;7、训练好的SVM模型分类预测测试样本;8、输出对测试样本的测试结果。最后,实施本专利技术具有以下有益效果:本专利技术实施例的有益效果是,通过分析用户智能手机的流量数据可以对用户的性别、年龄等基础属性做出预测,经过实验能够获得有效的预测效果。附图说明附图是本专利技术提出的一种基于智能手机流量数据的用户基础属性预测方法的算法流程。具体实施方式下面结合附图对本专利技术的具体实施方式进行描述,以便本领域的技术人员更好地理解本专利技术。在本实施例中,如图所示,提供本专利技术提出的方法的算法流程:步骤101、使用智能手机操作系统提供的API,记录智能手机一段时间里使用流量的详细情况。通过Android操作系统(实验采用的手机操作系统)提供的网络API接口,实时监测一段时间里智能手机所有APP使用流量的情况,并且记录下来。步骤102、根据用户在这一段时间里智能手机的使用情况,计算各APP从每次产生流量到下一次该APP被使用的时间间隔,按APP名称将其分组,每个APP分别对应一组时间间隔。分别计算用户智能手机里所有APP从每次产生流量到下一次打开该APP(即手机屏幕处于开屏状态且该APP处于前台)的时间间隔,每个APP得到一组时间间隔,故用户按所安装的APP得到多组时间间隔。步骤103、对各组时间间隔统计分析,计算并提取其特征值。一组时间间隔提取m个特征值,构成特征向量(特征值1,特征值2,…,特征值m)1×m,用户使用n个APP,可得到向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)1×(mn+1)。用户智能手机安装有n个APP,则有n组时间间隔,对每一组时间间隔提取m个特征值,故用户智能手机可以得到mn个特征值,即向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)1×(mn+1)。其中每一个APPk(1<=k<=n)特征向量代表该用户对此APP的使用特征,不同用户属性的用户对同一APP具有不同的特征向量,同一用户属性的用户对不同APP具有不同的特征向量,但同一用户属性的用户对同一APP具有类似的特征向量。步骤104、将向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)转化为用户的特征值矩阵R。计算得到向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量),APP数量为n,将同一个用户智能手机的APP特征向量统计到一行,按用户ID统计成一列,最后得到用户的特征值矩阵。步骤105、通过关键字用户ID,将用户的特征值矩阵和用户的基础属性关联,将用户的基础属性设置为类标。用户的性别为男和女两类,用户的年龄为青少年(<18岁)、少年(18-24)、青年(25-34)、中年(35-49)和老年(>50)五类。步骤106、将数据随机等分为训练集和测试集,训练集用于训练SVM分类模型。将数据随机等分,一份用于训练,一分用于测试,SVM采用RBF核函数,对于性别和年龄分别训练SVM模型。步骤107、训练好的SVM模型预测测试集。用训练的SVM性别分类模型和年龄分类模型分别测试测试集的数据。步骤108、输出对测试样本的预测测试结果。对预测结果进行输出。尽管上面对本专利技术说明性的具体实施方式进行了描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利求限本文档来自技高网
...
一种基于智能手机流量数据的用户基础属性预测方法

【技术保护点】
一种基于智能手机流量数据的用户基础属性预测方法:其特征在于,首先使用智能手机操作系统提供的API,记录智能手机一段时间里使用流量的详细情况;计算出这一段时间里各APP从每次产生流量到下一次该APP被使用的时间间隔,每个APP分别对应一组时间间隔;对每一组时间间隔提取特征值,一组时间间隔提取m个特征值,用户使用n个APP,可得到向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)1×(mn+1);将向量(用户ID,APP1特征向量,APP2特征向量,…,APPn特征向量)转化为用户的特征值矩阵;通过用户ID关联用户的基础属性,将用户的基础属性作为类标;将数据随机分为训练集和测试集,对性别和年龄分别训练SVM预测模型,SVM模型中采用RBF核函数;用训练的模型预测测试集,并对测试结果输出。

【技术特征摘要】
1.一种基于智能手机流量数据的用户基础属性预测方法:其特征在于,首先使用智能手机操作系统提供的API,记录智能手机一段时间里使用流量的详细情况;计算出这一段时间里各APP从每次产生流量到下一次该APP被使用的时间间隔,每个APP分别对应一组时间间隔;对每一组时间间隔提取特征值,一组时间间隔提取m个特征值,用户使用n个APP,可得到向量(用户ID,APP1特征...

【专利技术属性】
技术研发人员:秦臻唐远洋程红蓉
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1