一种基于用户时间碎片的业务偏好识别方法技术

技术编号:14845516 阅读:69 留言:0更新日期:2017-03-17 12:00
本发明专利技术提供一种基于用户时间碎片的业务偏好识别方法,包括:步骤1、客户手机上网WAP日志采集;步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容分类处理;步骤3、基于用户每月WAP日志,描述和分析用户流量波动;步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的时间序列片段以及碎片时间的需求偏好,得到群体特征描述。利用本发明专利技术的方法,可分析用户各碎片时间段的不同需求,提高客户感知水平。

【技术实现步骤摘要】

本专利技术涉及移动互联网
,尤其是用户的业务偏好识别,具体而言涉及一种基于用户时间碎片的业务偏好识别方法
技术介绍
移动互联网产业发展较为迅速,已经出现了很多受人们喜爱的应用和服务,尤其是碎片化时代的来临更加促进了移动互联网产业的发展,所以碎片时间也逐渐引起了人们的关注和重视。由于移动互联网用户的上网频率和时长所形成的黏性,成为移动互联网产业快速发展的必要条件,故发展移动互联网,必须研究移动互联网用户的行为习惯,以及如何更加巧妙的利用用户的碎片化时间进行产品的创新成为了移动互联网产业链中的内容制造商及服务运营商们需要研究的重点。运营商需要更加精细地研究用户的行为,分析碎片化特点,设计更好的应用和服务,在未来的市场竞争中占据主动。尼尔森在线研究的调查结果显示(见图1),56%的用户一天多次移动上网,72%用户每天至少一次移动上网;21%的用户每次移动上网时长超过1小时,42%的用户每次移动上网超过30分钟;78%的用户移动上网来消磨时间,72%的用户在独自一个人时会使用移动上网,70%的用户会在交通工具上移动上网。这些都显示了用户上网的需求及上网时间的碎片化。目前对于客户的研究主要还集中在客户的偏好情况,但是用户的需求越来越个性化,具体化,这就需要去把握客户在不同时间上的需求,并找出不同群体时间上的共同点,以方便网络的优化和产品的营销。对于用户在不同时间上的需求偏好目前还没有具体的研究及应用案例。目前产品的营销过程,主要根据客户的整体偏好标签来提取目标号码支撑营销(见图2),具体如下:1、首先根据用户整体偏好形成一个总体标签库;2、根据新的需求,匹配产品与用户整体偏好标签;3、针对这个需求做事件营销。由于目前客户的需求更加具体化、个性化,单纯的以客户整体偏好来提取目标号码,丢掉了客户在不同时间的需求不同,在产品推广及营销的过程中会造成客户感知下降,响应低等问题。比如说,白领早上7点到9点偏好QQ和UC浏览器,而外来工偏好飞信(见图3)。互联网及移动互联网的信息都是瞬间变化的,传统的用户需求偏好的识别方法考虑的是用户的整体偏好,时间观念不强,而且时间周期长,已经不能满足信息变化的脚步。
技术实现思路
本专利技术目的在于提供一种基于用户时间碎片的业务偏好识别方法,旨在抓住移动互联网瞬间变换的有利信息,基于用户时间碎片识别出对应客户的业务偏好,从而提高运营商的业务发展效率。本专利技术的上述目的通过独立权利要求的技术特征实现,从属权利要求以另选或有利的方式发展独立权利要求的技术特征。为达成上述目的,本专利技术提出一种基于用户时间碎片的业务偏好识别方法,包括:步骤1、客户手机上网WAP日志采集,并将采集的数据传入数据库服务器;步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容分类处理;步骤3、基于用户每月WAP日志,描述和分析用户流量波动;步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的时间序列片段以及碎片时间的需求偏好,得到群体特征描述。进一步的实施例中,在前述步骤4的曲线分段拟合过程中,采用检索边界点的分割方法,对给定时间间距阈值与幅值比阈值拟合相应的分段函数,确定函数中关键变化的点,然后以检索出的点为边界划分成各个子序列,提取个人用户时间碎片。具体地,检索边界点的分割方法,包括以下步骤:假设时间序列为S=(s1s2……si……sn),其中si=yi,i为时间刻度值,yi为i时刻的流量幅度值,i取值为[1,1440],假设边界点集A=(a1a2……ai……ak),则我们能根据分割点得出k条线性回归方程,其集合为F=(fi(w1,x1)f2(w2,x2)……fi(wi,xi)……fk(wk,xk),即:其中:εi(xi)是第i段的误差项εi(xi)均值为零的高斯白色噪声函数fi(wi,xi)=wi*xi+bi具体流程如下:首先,检索分段时间的边界点的方法如下:a.给定流量幅值比例阈值δ,0≤δ≤1,流量参考点G,G取大于零的常量b.扫描数据库服务器,以时间先后为序,依次求出ti时刻的流量幅值与G的比值为Bi,1≤i≤1440;c.满足比例值|Bi+1-Bi|≥δ时,则记录此时刻ti、幅值比Bi,并设ti为其中一个分割点aj,最终形成分割点集合A。d.以分割点集合A为边界将连续时间序列分成k子序列Sub=(sub1sub2……subi……subk),其中subi=yt|t∈[ai-1,ai)。以ti,Ai集合中每一点为分界点,分时间序列为各子序列,对F使用最小二乘法进行拟合,每个子回归函数的拟合样本为其对应的subi,经过最小二乘法拟合后,得到每个模型的wi和bi。应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的专利技术主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的专利技术主题的一部分。结合附图从下面的描述中可以更加全面地理解本专利技术教导的前述和其他方面、实施例和特征。本专利技术的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本专利技术教导的具体实施方式的实践中得知。附图说明附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本专利技术的各个方面的实施例,其中:图1是移动互联网应用调查结果示意图。图2是产品营销过程示意图。图3是不同用户群体的不同上网时间示意图。图4是本专利技术的基于用户时间碎片识别的原理示意图。图5是本专利技术的基于用户时间碎片识别的互联网触点方法的示意图。图6是用户日流量波动图。图7是时间段划分后的示意图。图8是基于用户时间碎片识别的用户标签输出作为其他营销系统、网络优化系统及客服系统等来调用的示意图。具体实施方式为了更了解本专利技术的
技术实现思路
,特举具体实施例并配合所附图式说明如下。在本公开中参照附图来描述本专利技术的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定意在包括本专利技术的所有方面。应当理解本文档来自技高网
...

【技术保护点】
一种基于用户时间碎片的业务偏好识别方法,其特征在于,包括:步骤1、客户手机上网WAP日志采集,并将采集的数据传入数据库服务器;步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容分类处理;步骤3、基于用户每月WAP日志,描述和分析用户流量波动;步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的时间序列片段以及碎片时间的需求偏好,得到群体特征描述。

【技术特征摘要】
1.一种基于用户时间碎片的业务偏好识别方法,其特征在于,包括:
步骤1、客户手机上网WAP日志采集,并将采集的数据传入数据库服务器;
步骤2、数据预处理,对采集的数据进行清洗转换、会话识别分析以及内容
分类处理;
步骤3、基于用户每月WAP日志,描述和分析用户流量波动;
步骤4、综合每个用户的月WAP日志数据,进行曲线分段拟合;
步骤5、基于曲线分段拟合结果,提取个人用户时间碎片;
步骤6、基于个人用户时间碎片提取结果,对用户时间序列进行相似性聚类,
以区分具有相似形态的用户群体,再统计同一类用户群体中的碎片时间集中的
时间序列片段以及碎片时间的需求偏好,得到群体特征描述。
2.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤1中,客户手机WAP日志的采集,具体包括:在IP承载网中
的汇聚CE至AR间的链路中进行GB口的采集,在汇聚CE设备进行端口镜像
复制方式采集,然后将采集到的数据通过信令解码平台对数据进行实时解码,
并将解码后的数据共享到数据共享设备,然后通过FTP接口传入到数据库服务
器。
3.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤2中,对采集数据的清洗转换,包括对采集数据的填补遗漏数
据处理、平滑有噪声数据以及解决数据不一致处理。
4.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,所述步骤2中,会话识别分析是指基于时间阈值或者基于用户访问页面
时的参引页面来识别用户从进入站点到离开站点期间所访问的一系列页面序列
集合。
5.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,前述步骤2中,内容分类处理包括:对WAP日志数据得到的URL进行

\t解析,抽取关键信息,根据这些信息进行分类,建立实例库,当新的URL输入
的时候,就进行实例库匹配,若没有此URL的实例,则更新实例库。
6.根据权利要求1所述的基于用户时间碎片的业务偏好识别方法,其特征
在于,在前述步骤4的曲线分段拟合过程中,采用检索边界点的分割方法,对
给定时间间距阈值与幅值比阈值拟合相应的分段函数,确定函数中关键变化的
点,然后以检索出的点为边界划分成各个子序列,提取个人用户时间碎片。
7...

【专利技术属性】
技术研发人员:杨志兵李百成
申请(专利权)人:中兴软创科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1