用户行为分析的控制方法和用户行为分析的控制系统技术方案

技术编号:13378461 阅读:61 留言:0更新日期:2016-07-21 07:26
本发明专利技术提供了一种用户行为分析的控制方法和用户行为分析的控制系统,其中,用户行为分析的控制方法包括:获取软件开发工具上报的用户行为数据;将所述用户行为数据存储至分布式文件系统,以确定为待分析数据;通过通用并行映射‑归约编程模型处理所述待分析数据,以完成对所述用户行为数据的分析,其中,所述用户行为数据为半格式化数据。通过本发明专利技术技术方案,基于更新后的分析模板实现了用户行为数据的高速迭代处理,同时实现了实时查询和离线计算等效果。

【技术实现步骤摘要】

本专利技术涉及软件开发
,具体而言,涉及一种用户行为分析的控制方法和一种用户行为分析的控制系统。
技术介绍
在相关技术中,随着移动互联网与云服务的发展,移动应用软件呈现井喷式增长,为了改善与优化移动应用产品,提高用户对移动应用软件的用户体验,开发人员需要统计移动终端用户的使用习惯,用户的行为分析,应用软件的性能与质量等相关数据。虽然目前市场上已经出现专门的移动应用软件的统计工具,但这些工具在用户定位和个性化定制方面都不够完善,并且统计过程中不能够保证用户信息的准确性,并且离线处理过程产生较大的数据交互压力。因此,如何设计一种新的用户行为分析的控制方案以提高分析效率和离线计算和查询效率成为亟待解决的技术问题。
技术实现思路
本专利技术正是基于上述技术问题至少之一,提出了一种新的用户行为分析的控制方案,通过分布式文件系统和更新后的分析模板实现了用户行为数据的高速迭代处理,同时实现了实时查询和离线计算等效果,使产品开发人员对用户行为的了解更加全面与完整,提升了移动应用软件的开发质量与相关服务器的稳定性,提高了用户对产品的使用体验,从而可以提升产品的知名度,增加产品的用户数量。有鉴于此,本专利技术提出了一种用户行为分析的控制方法,包括:获取软件开发工具上报的用户行为数据;将所述用户行为数据存储至分布式文件系统,以确定为待分析数据;通过通用并行映射-归约编程模型处理所述待分析数据,以完成对所述用户行为数据的分析,其中,所述用户行为数据为半格式化数据。在该技术方案中,通过并行映射-归约编程模型(即SparkMapReduce,后文简称SparkMR)对用户行为数据进行分析,另外,基于分布式文件系统(即hdfs)和更新后的分析模板实现了用户行为数据的高速迭代处理,同时实现了实时查询和离线计算等效果,使产品开发人员对用户行为的了解更加全面与完整,提升了移动应用软件的开发质量与相关服务器的稳定性,提高了用户对产品的使用体验,从而可以提升产品的知名度,增加产品的用户数量。具体地,通过消息中间件如kafka从软件开发工具(SoftDevelopmentKit,即sdk)获取用户行为数据,用户行为数据采用半格式化数据如json(JavaScriptObjectNotation,数据交换格式),鉴于json基于键值的灵活格式非常易于扩展,并且可基于json数据的事件类型确定对应的json组件。其中,通过SparkMR将半格式化数据转换为格式化数据后进行标准离线数据处理计算,也即一方面实现SparkSQL查询,另一方面实现离线计算hive,进一步地,根据分析的用户行为数据生成关系型查询语句(即SQL)和非关系型查询语句(即NoSQL),并借助报表展示系统对分析后的用户行为数据进行展示,同时,向用户提供数据调用接口以供用户访问。在上述技术方案中,优选地,通过通用并行映射-归约编程模型处理所述待分析数据,以完成对所述用户行为数据的分析,具体包括以下步骤:将所述用户行为数据由半格式化数据转换为格式化数据,以获取格式化的待分析数据;检测数据库是否存在管理员客户端对分析模板的更新信息;在检测到所述数据库存在所述管理员客户端对所述分析模板的更新信息时,通过更新后的分析模板对转换为所述格式化数据的用户行为数据进行查询和/或离线分析。在该技术方案中,通过检测分析模板的更新信息,以实现数据分析过程的更新,进一步地提高了数据分析过程的实用性和灵活性。在上述任一项技术方案中,优选地,还包括:根据完成查询和/或离线分析的用户行为数据生成关系型查询语句和/或非关系型查询语句。在该技术方案中,通过根据完成查询和/或离线分析的用户行为数据生成关系型查询语句和/或非关系型查询语句,其中,关系型查询语句有助于提高分析数据的关联性,而非关系型数据有助于减小数据交互压力,进而提高数据访问量。在上述技术方案中,优选地,还包括:通过开源可视化工具创建完成查询和/或离线分析的用户行为数据的可视化界面,并提示给用户。在该技术方案中,通过开源可视化工具创建可视化界面,提升了用户分析的实时性和用户体验,其中,开源可视化工具的一种实施方式为百度echart工具。在上述技术方案中,优选地,还包括:将完成查询和/或离线分析的用户行为数据发送至调用接口,以供用户通过所述调用接口对所述查询和/或离线分析的用户行为数据进行访问。在该技术方案中,通过将完成查询和/或离线分析的用户行为数据发送至调用接口,提升了用户查询和/或离线分析数据的便捷性和可扩展性。根据本专利技术第二方面,还提出了一种用户行为分析的控制系统,包括:获取单元,获取软件开发工具上报的用户行为数据;存储单元,用于将所述用户行为数据存储至分布式文件系统,以确定为待分析数据;分析单元,用于通过通用并行映射-归约编程模型处理所述待分析数据,以完成对所述用户行为数据的分析,其中,所述用户行为数据为半格式化数据。通过并行映射-归约编程模型(即SparkMapReduce,后文简称SparkMR)对用户行为数据进行分析,另外,基于分布式文件系统(即hdfs)和更新后的分析模板实现了用户行为数据的高速迭代处理,同时实现了实时查询和离线计算等效果,使产品开发人员对用户行为的了解更加全面与完整,提升了移动应用软件的开发质量与相关服务器的稳定性,提高了用户对产品的使用体验,从而可以提升产品的知名度,增加产品的用户数量。具体地,通过消息中间件如kafka从软件开发工具(SoftDevelopmentKit,即sdk)获取用户行为数据,用户行为数据采用半格式化数据如json(JavaScriptObjectNotation,数据交换格式),鉴于json基于键值的灵活格式非常易于扩展,并且可基于json数据的事件类型确定对应的json组件。其中,通过SparkMR将半格式化数据转换为格式化数据后进行标准离线数据处理计算,也即一方面实现SparkSQL查询,另一方面实现离线计算hive,进一步地,根据分析的用户行为数据生成关系型查询语句(即SQL)和非关系型查询语句(即NoSQL),并借助报表展示系统对分析后的用户行为数据进行展示,同时,向用户提供数据调用接口以供用户访问。在上述技术方案中,优选地,所述分析单元包括:转换单元,用于将所述用户行为数据由半格式化数据转换为格式化数据,本文档来自技高网...

【技术保护点】
一种用户行为分析的控制方法,其特征在于,包括:获取软件开发工具上报的用户行为数据;将所述用户行为数据存储至分布式文件系统,以确定为待分析数据;通过通用并行映射‑归约编程模型处理所述待分析数据,以完成对所述用户行为数据的分析,其中,所述用户行为数据为半格式化数据。

【技术特征摘要】
1.一种用户行为分析的控制方法,其特征在于,包括:
获取软件开发工具上报的用户行为数据;
将所述用户行为数据存储至分布式文件系统,以确定为待分析数据;
通过通用并行映射-归约编程模型处理所述待分析数据,以完成对所
述用户行为数据的分析,
其中,所述用户行为数据为半格式化数据。
2.根据权利要求1所述的用户行为分析的控制方法,其特征在于,
通过通用并行映射-归约编程模型处理所述待分析数据,以完成对所述用
户行为数据的分析,具体包括以下步骤:
将所述用户行为数据由半格式化数据转换为格式化数据,以获取格式
化的待分析数据;
检测数据库是否存在管理员客户端对分析模板的更新信息;
在检测到所述数据库存在所述管理员客户端对所述分析模板的更新信
息时,通过更新后的分析模板对转换为所述格式化数据的用户行为数据进
行查询和/或离线分析。
3.根据权利要求1或2所述的用户行为分析的控制方法,其特征在
于,还包括:
根据完成查询和/或离线分析的用户行为数据生成关系型查询语句和/
或非关系型查询语句。
4.根据权利要求3所述的用户行为分析的控制方法,其特征在于,
还包括:
通过开源可视化工具创建完成所述查询和/或离线分析的用户行为数
据的可视化界面,并提示给用户。
5.根据权利要求3所述的用户行为分析的控制方法,其特征在于,
还包括:
将完成所述查询和/或离线分析的用户行为数据发送至调用接口,以
供用户通过所述调用接口对所述查询和/或离线分析的用户行为数据进行
访问。
6.一种用户行为分析的控...

【专利技术属性】
技术研发人员:张永军
申请(专利权)人:畅捷通信息技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1