【技术实现步骤摘要】
本专利技术涉及移动互联网
,尤其是用户的业务偏好识别,具体而言涉及一种基于用户时间碎片的业务偏好识别方法。
技术介绍
移动互联网产业发展较为迅速,已经出现了很多受人们喜爱的应用和服务,尤其是碎片化时代的来临更加促进了移动互联网产业的发展,所以碎片时间也逐渐引起了人们的关注和重视。由于移动互联网用户的上网频率和时长所形成的黏性,成为移动互联网产业快速发展的必要条件,故发展移动互联网,必须研究移动互联网用户的行为习惯,以及如何更加巧妙的利用用户的碎片化时间进行产品的创新成为了移动互联网产业链中的内容制造商及服务运营商们需要研究的重点。运营商需要更加精细地研究用户的行为,分析碎片化特点,设计更好的应用和服务,在未来的市场竞争中占据主动。尼尔森在线研究的调查结果显示(见图1),56%的用户一天多次移动上网,72%用户每天至少一次移动上网;21%的用户每次移动上网时长超过1小时,42%的用户每次移动上网超过30分钟;78%的用户移动上网来消磨时间,72%的用户在独自一个人时会使用移动上网,70%的用户会在交通工具上移动上网。这些都显示了用户上网的需求及上网时间的碎片化。目前对于客户的研究主要还集中在客户的偏好情况,但是用户的需求越来越个性化,具体化,这就需要去把握客户在不同时间上的需求,并找出不同群体时间上的共同点,以方便网络的优化和产品的营销。对于用户在不同时间上的需求偏好目前还没有具体的研究及应用 ...
【技术保护点】
一种基于用户时间碎片的业务偏好识别方法,其特征在于,包括:步骤1、客户手机上网WAP日志采集,并将采集的数据传入数据库服务器;步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容分类处理;步骤3、基于用户每月WAP日志,描述和分析用户流量波动;步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的时间序列片段以及碎片时间的需求偏好,得到群体特征描述。
【技术特征摘要】
1.一种基于用户时间碎片的业务偏好识别方法,其特征在于,包括:
步骤1、客户手机上网WAP日志采集,并将采集的数据传入数据库服务器;
步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容
分类处理;
步骤3、基于用户每月WAP日志,描述和分析用户流量波动;
步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;
步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;
步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,
以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的
时间序列片段以及碎片时间的需求偏好,得到群体特征描述。
2.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤1中,客户手机WAP日志的采集,具体包括:在IP承载网中
的汇聚CE至AR间的链路中进行GB口的采集,在汇聚CE设备进行端口镜像
复制方式采集,然后将采集到的数据通过信令解码平台对数据进行实时解码,
并将解码后的数据共享到数据共享设备,然后通过FTP接口传入到数据库服务
器。
3.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤2中,对采集数据的清洗转换,包括对采集数据的填补遗漏数
据处理、平滑有噪声数据以及解决数据不一致处理。
4.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤2中,会话识别分析是指基于时间阈值或者基于用户访问页面
时的参引页面来识别用户从进入站点到离开站点期间所访问的一系列页面序列
集合。
5.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,前述步骤2中,内容分类处理包括:对WAP日志数据得到的URL进行
\t解析,抽取关键信息,根据这些信息进行分类,建立实例库,当新的URL输入
的时候,就进行实例库匹配,若没有此URL的实例,则更新实例库。
6.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,在前述步骤4的曲线分段拟合过程中,采用检索边界点的分割方法,对
给定时间间距阈值与幅值比阈值拟合相应的分段函数,确定函数中关键变化的
点,然后以检索出的点为边界划分成各个子序列,提取个人用户时间碎片。
7...
【专利技术属性】
技术研发人员:杨志兵,李百成,
申请(专利权)人:中兴软创科技股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。