页面访问数据的处理方法和装置制造方法及图纸

技术编号:15194189 阅读:48 留言:0更新日期:2017-04-20 15:50
本发明专利技术公开了一种页面访问数据的处理方法和装置。其中,该方法包括:从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。本发明专利技术解决了现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题。

【技术实现步骤摘要】

本专利技术涉及互联网领域,具体而言,涉及一种页面访问数据的处理方法和装置。
技术介绍
用户行为分析是互联网中一个十分常见的问题。目前,互联网上绝大多数网站均会通过日志的形式对访问网站的信息进行记录,通过对访问网站的日志进行分析,可以分析出用户的行为。现有的用户行为分析方法采用统计的手段,通过访问的会话信息,区分用户。通过统计访问网站的用户的浏览器、来源的地理位置、登录的时间、访问的页面和时间长度等信息描述用户行为,并进行统计,达到用户行为分析的目的。但是现有技术中用于分析用户行为的方法仅仅采用统计方法,只能对单个访问的页面信息进行统计,无法对多个访问的页面之间的关系进行分析,导致用户行为的分析结果不准确、不完整。针对现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种页面访问数据的处理方法和装置,以至少解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的技术问题。根据本专利技术实施例的一个方面,提供了一种页面访问数据的处理方法,包括:从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;根据事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。根据本专利技术实施例的另一方面,还提供了一种页面访问数据的处理装置,包括提取模块,用于从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;生成模块,用于对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;输出模块,用根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。在本专利技术实施例中,在从数据库的页面访问日志中提取事件日志之后,对上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,并且根据上述流程模型输出用户访问页面所产生的行为数据。因此,上述方案可以实现从流程角度对用户行为进行分析,输出用户行为数据。容易注意到,由于上述事件日志中的多个事件的信息进行流程挖掘,生成与上述事件日志对应流程模型,通过对用户访问页面的访问流程进行建模,得到用户行为数据,这样不仅实现了从流程角度对用户行为进行分析,进一步还可以从流程模型中得到用户访问页面的主要浏览顺序,从而解决现有技术中用于分析用户行为的方法仅仅采用统计方法,导致用户行为分析的结果不准确,不完整的问题。由此可知,本申请上述实施例,通过对事件日志中包含的事件的信息进行流程挖掘,生成流程模型,得到用户行为数据,实现准确、完整分析用户行为的目的,提升用户的好感度。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种页面访问数据的处理方法的流程图;图2是根据本专利技术实施例的一种可选的流程模型的示意图;图3是根据本专利技术实施例的一种页面访问数据的处理装置的示意图;图4是根据本专利技术实施例的一种可选的页面访问数据的处理装置的示意图;图5是根据本专利技术实施例的另一种可选的页面访问数据的处理装置的示意图;以及图6是根据本专利技术实施例的第三种可选的页面访问数据的处理装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面对本专利技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:用户行为分析:在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律。流程挖掘:流程挖掘是一个流程管理的技术,允许基于时间日志对业务流程进行分析。会话:用户从开始页面访问到结束页面访问所进行的一系列操作。事件:用户访问页面对控件进行的操作,例如点击按钮,加载网页等。XML格式:是可扩展标记语言(ExtensibleMarkupLanguage)的缩写,是一种标记语言,用来传输和存储数据。SQL语句:是结构化查询语言(StructuredQueryLanguage)的缩写,是一种数据库查询和程序设计语言,用于数据库中的标准数据查询语言。csv格式:是逗号分隔值(CommaSeparatedValues)的缩写,通常是文本文件,用WORDPAD或记事本,EXCEL打开。实施例1根据本专利技术实施例,提供了一种页面访问数据的处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的一种页面访问数据的处理方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,从页面访问日志中提取事件日志,其中,事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息。具体的,用户访问网站的页面访问日志可以存储在数据库中,页面访问日志可以是一种XML格式的文件,用于保存会话信息,访问网站的用户的浏览器,来源的地理位置,登录的时间,访问的页面和时间长度等数据。事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息,可以通过查询方式从存储在数据库中的页面访问日志中查找得到相应的数据信息。会话编号可以用来判断访问页面的访问用户,不同用户分配不同的会话编号,因此可以使用会话编号区分不同的用户。会话可以包含用户访问多个网站产生的多个事件,并且由于访问时间的不同,产生的多个事件具有一定的产生顺序。步骤S104,对事件日志中所包含的多个事件的信息进行流程挖掘,生成事件日志对应的流程模型,其中,流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息。具体的,在事件日志中对应本文档来自技高网
...
页面访问数据的处理方法和装置

【技术保护点】
一种页面访问数据的处理方法,其特征在于,包括:从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;以及根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。

【技术特征摘要】
1.一种页面访问数据的处理方法,其特征在于,包括:从页面访问日志中提取事件日志,其中,所述事件日志包括:多个会话、每个会话的会话编号以及任意一个会话所包含的多个事件的信息;对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,生成所述事件日志对应的流程模型,其中,所述流程模型包括:每个事件的标题信息以及任意两个事件之间的跳转信息;以及根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据。2.根据权利要求1所述的方法,其特征在于,所述事件的信息包括:所述用户访问页面之后所产生事件的标题信息和对应的访问时间。3.根据权利要求2所述的方法,其特征在于,从页面访问日志中提取事件日志的步骤包括:获取预设的查询条件,其中,所述查询条件至少包括如下字段:会话编号、时间戳和用户访问的页面的标题信息;根据所述查询条件从数据库中保存的所述页面访问日志,查询得到满足所述查询条件的数据信息;以及将所述数据信息保存为指定格式的文件,得到所述事件日志。4.根据权利要求2所述的方法,其特征在于,对所述事件日志中所包含的所述多个事件的信息进行流程挖掘,得到所述事件日志所对应的流程模型包括:结合所述事件日志中的所述会话编号和所述访问时间,对所述事件日志中包含的所述多个事件进行排序,确定所述事件日志中所述每个事件的发生顺序;结合所述事件日志中所述每个事件的所述会话编号和所述发生顺序,获取所述任意两个事件之间的跳转信息;以及按照所述每个事件的标题信息和所述任意两个事件之间的跳转信息,获取按照有向图结构表征的流程模型。5.根据权利要求4所述的方法,其特征在于,根据所述事件日志所对应的流程模型,输出用户访问页面所产生的行为数据的步骤包括:步骤A,获取所述有向图结构表征的流程模型中,每一个事件所对应的会话数量;步骤B,从所述流程模型中确定初始触发的事件的节点,并将初始触发的事件作为当前事件;步骤C,获取与当前事件具有跳转关系的至少一个事件;步骤D,从所述与当前事件具有跳转关系的至少一个事件中选择会话数量最大的事件,作为与当前事件关联的下一个事件;步骤E,将所述与当前事件关联...

【专利技术属性】
技术研发人员:郭秦龙
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1