一种基于手机号码的网民行为分析方法及系统技术方案

技术编号:13062884 阅读:46 留言:0更新日期:2016-03-24 01:40
本发明专利技术属于信息统计分析领域,具体涉及一种基于手机号码的网民行为分析方法及系统。本发明专利技术提出的一种基于手机号码的网民行为分析方法,对数据采集单元采集到的数据,首先进行格式校验,校验手机号码字段是否正确,若错误,则将数据去掉,对于通过验证的数据进行处理,得到手机号码区域信息,接着对单个网民的网络行为进行分析和区域内网民的网络行为进行分析。本发明专利技术可用于将同一公司内部的网民行为数据进行采集、整理、分析从而能够为网民制定更人性化的信息服务。

【技术实现步骤摘要】

本专利技术属于信息统计分析领域,具体涉及一种基于手机号码的网民行为分析方法及系统
技术介绍
《中国互联网络发展状况统计报告》显示截至2015年6月我国的网民规模达6.68亿互联网普及率为48.8%,其中手机网民规模达5.94亿人,占我国总网民数的88.9%。随着手机终端大屏化和手机应用体验的不断提升,手机作为网民主要上网终端的趋势进一步明显。手机将作为我国互联网民接入的主要终端,网民将在手机端完成大部分的网络行为,伴随着手机号+短信验证码这种安全校验的风控模型的逐渐完善,网民将逐渐使用手机号码作为网络ID进行网络资源的访问通行证。随着近几年互联网技术的快速发展,各行各业的互联网领导厂商已经基本确定、网络平台逐步的稳定、网民的网络行为也将趋向于规律。互联网市场的服务由原来的大范围撒网式服务,逐渐趋向于精细化服务,要想将网民牢牢的拴在自己的平台上,让其成为企业平台终极粉丝,那就需要互联网企业能够为网民提供人性化、个性化的服务。为了能够提供人性化、个性化的服务就需要针对单个网民个体的上网行为进行分析。目前互联网企业的各个业务平台分析网民的行为处理方法是独立针对特定的业务系统独立开发一套行为分析平台,且各个业务系统间数据格式不统一,这就造成独立开发的行为分析平台的数据格式也不统一,这使得企业决策者如果需要站在比较高的层次上做决策的时候,就需要在各个业务系统对应的行为分析模块单独查询、收集数据后手动进行分析,这样处理比较费时、费力,而且分析的结果不全面、不准确。
技术实现思路
针对现有技术存在的问题,本专利技术提出的一种基于手机号码的网民行为分析方法,对数据采集单元采集到的数据,首先进行格式校验,校验手机号码字段是否正确,若错误,则将数据去掉,对于通过验证的数据进行处理,得到手机号码区域信息,接着对单个网民的网络行为进行分析和区域内网民的网络行为进行分析。本专利技术提出了一种基于手机号码的网民行为分析系统,根据业务系统实现的环境的不同,将数据采集单元从整个分析系统中独立出来,将采集到的数据以统一的数据结构和数据格式,传送给消息中间服务器,数据处理与分析单元对这些数据统一的处理、分析等操作。本专利技术采用如下技术方案: 一种基于手机号码的网民行为分析方法,包括以下步骤: S1,数据采集单元设置于业务系统中,从业务系统中采集数据,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码; S2,数据处理与分析单元对消息中间服务器中的数据进行处理,对数据中的手机号码字段进行校验,若校验错误,则将该数据去掉; S3,校验通过的数据,处理得到手机号码对应的区域信息,并将数据进行存储; S4,基于手机号码对单个网民的网络行为进行分析,和基于区域信息对区域内网民的网络行为进行分析。进一步的,步骤S1中数据结构还包括网民的网络行为和网络行为发生时间。进一步的,步骤S1中数据采集单元将采集到的数据以Json格式传输到消息中间服务器中。进一步的,步骤S1中包括多个数据采集单元,设置在多个业务系统中采集数据。—种基于手机号码的网民行为分析系统,它包括数据采集单元、消息中间服务器和数据处理与分析单元, 数据采集单元,用于采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码; 消息中间服务器,消息中间服务器用于存储数据采集单元传输来的数据; 数据处理与分析单元,从消息中间服务器下载数据,并对这些数据进行处理与分析,得到单个网民的网络行为分析结果和区域内网民的网络行为分析结果。进一步的,数据采集单元将采集到的数据格式为Json格式。进一步的,数据结构还包括网民的网络行为和网络行为发生时间。进一步的,该系统包括多个数据采集单元,设置在多个业务系统中采集数据。进一步的,数据处理与分析单元,包括数据格式校验模块、手机号码区域识别模块、数据存储模块和行为分析模块; 数据格式校验模块从消息中间服务器下载的数据进行校验,主要校验数据中的手机号码字段,若无手机号码或手机号码格式错误,则将该数据去掉; 手机号码区域识别模块处理校验通过的手机号码,得到手机号码对应的区域信息,该模块输出的数据结构包括手机号码、区域编码、网络行为、网络行为发生时间; 数据存储模块,将手机号码区域识别模块输出的数据进行分类存储; 行为分析模块,基于手机号码进行单个网民的网络行为、网络行为发生时间的多维度分析,基于区域进行区域网民的网络行为、网络行为发生时间的多维度分析。更进一步的,行为分析模块独立部署,或作为现有的业务系统功能模块嵌入到业务系统。本专利技术的数据采集单元与数据处理与分析单元通过消息中间件服务器进行通信,降低了系统间的耦合度。数据采集单元可部署在不同的业务系统中,采集不同业务系统的数据,以统一的数据结构和数据格式发送给信息中间服务器。在同一公司的不同业务系统,只要通过一个手机号码就能检索到持有这个手机号码的网民的行为数据,将同一公司内部的网民行为数据进行采集、整理、分析从而能够为网民制定更人性化的信息服务。【附图说明】图1是基于手机号码的网民行为分析系统的结构图; 图2是基于手机号码的网民行为分析系统的数据分析与处理单元结构图;图3是数据分析与处理单元的流程图。【具体实施方式】为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。现结合附图和【具体实施方式】对本专利技术进一步说明。参阅图1所示,为基于手机号码的网民行为分析系统的结构图,它包括数据采集单元1、消息中间服务器2和数据处理与分析单元3,其中,本专利技术给出的实施例中包括三个数据采集单元1。数据采集单元1,用于采集数据,设置于业务系统中,采集的数据以统一的数据结构和数据格式发送到消息中间服务器2,数据结构至少包括网民的手机号码。将在业务系统中的有效源数据采集下来并传输到消息中间服务器2中。多个数据采集单元1设置在多个业务系统中,为了便于对数据的处理与分析,定义多个数据采集单元1将采集到的各个业务系统的有效源数据按指定的数据结构且以Json的数据格式传输到消息中间服务器2上,这样做的好处是大大降低了前端数据采集单元1与后端的数据处理与分析单元3的耦合性。在新的业务系统需要进行数据采集的时候,只需要在这个业务系统中设置一个数据采集单元1即可。该实施例中的数据采集单元1为数据采集钩子(Η00Κ)。该实施例数据采集单元1定义采集的数据格式为网民的手机号码、网络行为和网络行为发生时间,网络行为包括行为类型大类和行为类型小类。其中,行为类型大类表示网民的自身行为,例如网民在电商网站就会产生“购买”这个行为大类,而行为类型小类指的是行为类型大类发生的对象,在行为类型大类为“购买”下,行为类型小类就表示购买的“产品类型”。数据采集钩子通过消息中间件的方式,将采集到的数据传送的消息中间件服务器2上。[002当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于手机号码的网民行为分析方法,其特征在于:包括以下步骤:S1,数据采集单元设置于业务系统中,从业务系统中采集数据,采集的数据以统一的数据结构和数据格式发送到消息中间服务器,数据结构包括网民的手机号码;S2,数据处理与分析单元对消息中间服务器中的数据进行处理,对数据中的手机号码字段进行校验,若校验错误,则将该数据去掉;S3,校验通过的数据,处理得到手机号码对应的区域信息,并将数据进行存储;S4,基于手机号码对单个网民的网络行为进行分析,和基于区域信息对区域内网民的网络行为进行分析。

【技术特征摘要】

【专利技术属性】
技术研发人员:邱锋兴郑少明郭任煌黄峰罗佳高静峰
申请(专利权)人:厦门安胜网络科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1