【技术实现步骤摘要】
一种网站数据采集方法、装置、设备及存储介质
[0001]本专利技术涉及网页流量数据采集
,具体而言,涉及一种网站数据采集方法、装置、设备及存储介质。
技术介绍
[0002]目前,随着互联网技术的发展,功能研发到投产的周期越来越短,而功能埋点能够拿数据作为支撑,反映出用户对网站的反应,以及如何提高网站流量、改进网站性能,了解用户访问网站的行为,为更好地满足用户需求提供支持。随着互联网产品在人们生活中的普及,越来越多的互联网产品都具有功能埋点,成为了大数据抓手,例如,页面浏览数(PV)、独立访问者数量(UV),IP、页面停留时间、页面操作时间、页面访问次数、按钮点击次数、文件下载次数等,根据页面埋点可得到一些重要信息,如用户对网站的反应、浏览内容按访问习惯等。
[0003]在金融行业,尤其是银行,对管理系统的功能模块,审批流程等使用的把控更加严格,但是,却没有合适的数据抓手,来支撑管理层去决策功能的优化方向和策略。且由于行业内系统架构的特殊性,前后端分离,后端存在多个微服务情况,缺失一种统一的埋点策略来推进页面、后端服务接口的流量统计和监控功能,无法提供大数据基数。
技术实现思路
[0004]本专利技术的目的在于提供一种网站数据采集方法、装置、设备及存储介质,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:
[0005]第一方面,本申请提供了一种网站数据采集方法,包括:
[0006]获取第一服务请求信息以及所述第一服务请求信息对应的第一时间信息,所述第一服务请
【技术保护点】
【技术特征摘要】
1.一种网站数据采集方法,其特征在于,包括:获取第一服务请求信息以及所述第一服务请求信息对应的第一时间信息,所述第一服务请求信息为描述网站前端请求调用后端微服务器接口的信息;根据所述第一服务请求信息,得到第一关键参数,所述第一关键参数为从所述第一服务请求信息中解析提取的关键字段信息;根据所述第一时间信息和所述第一关键参数,得到用户数据信息,所述用户数据信息是根据所述第一时间信息的先后顺序,将所述第一关键参数中相同微服务器接口的所述第一服务请求信息进行合并后得到的信息;基于所述用户数据信息生成第一日志文件;根据所述第一时间信息、所述第一日志文件和预设存储单元,得到网站数据信息,所述网站数据信息是根据所述第一日志文件与所述预设存储单元之间的映射关系,并按照所述第一时间信息的先后顺序将所述第一日志文件存储至所述预设存储单元内的数据,所述预设存储单元是将数据库根据自定义字段分割成多个存储单元。2.根据权利要求1所述的网站数据采集方法,其特征在于,根据所述第一服务请求信息,得到第一关键参数之前还包括:配置网关的拦截规则,所述拦截规则为所述网关对所述服务请求进行主动拦截的元素集合,所述元素集合中的每个元素对应一种拦截信息;判断所述第一服务请求信息是否合法,若所述第一服务请求信息合法,则判断所述第一服务请求信息中的URL地址是否在第一预设信息内,所述第一预设信息为网关进行拦截操作的URL地址信息;若所述第一服务请求信息中的URL地址存在于所述第一预设信息内,则判断所述第一服务请求信息中的第一token信息是否为空;若所述第一服务请求信息中的第一token信息不为空,则根据所述第一服务请求信息得到所述关键参数。3.根据权利要求2所述的网站数据采集方法,其特征在于,判断所述第一服务请求信息中的第一token信息是否为空,包括:判断所述第一token信息与所述后端微服务器接口的第二token信息是否一致;若不一致,则将所述第一服务请求信息返回至所述网站前端;若一致,则将所述网站前端的信息放到第一服务请求信息中的属性attributes中。4.根据权利要求1所述的网站数据采集方法,其特征在于,所述网站数据采集方法,还包括:自定义AOP切面拦截的切入点,所述切入点包括拦截接口信息和拦截方法信息,所述拦截接口信息为服务组合的接口信息,所述服务组合为基于调用耦合关系由多个所述微服务器所形成的具有完整功能的服务;所述拦截方法信息为自定义注释的拦截规则;获取第二服务请求信息以及所述第二服务请求信息对应的第二时间信息,所述第二服务请求信息为描述后端不同的微服务器接口之间相互调用的信息;根据所述第二服务请求信息,得到第二关键参数集合,所述第二关键参数集合中的每个第二关键参数为从所述第二服务请求信息中解析得到的微服务器的信息;判断所述第二关键参数与所述切入点是否一致,若是,则根据所述第二时间信息的先后顺序和每个所述第二关键参数生成第二日志文件;
根据所述第二日志文件与所述预设存储单元之间的映射关系,并按照第二时间信息的先后顺序将所述第二日志文件分别存储至对应的所述预设存储单元内的数据。5.根据权利要求1所述的网站数据采集方法,其特征在于,所述网站数据采集方法,还包括:获取埋点配置数据,所述埋点配置数据包括设置于网站中的各埋点元素以及所述埋点元素的属性参数;响应于所述埋点元素的访问操作,获取所述访问操作对应的行为监测数据,所述访问操作为网站元素发起的可被检测到的操作,所述行为监测数据为描述用户行为的数据以及被访问信息的数据;根据所述访问操作对应的触发事件,得到第三日志文件,所述第三日志文件为服务器根据所述触发事件对所述行为监测数据做出相应处理后得到的数据,所述触发事件为描述所述网站向服务器发出变更数据请求的信息;根据所述埋点配置数据、所述第三日志文件和所述预设存储单元,得到网站数据,所述网站数据是根据所述埋点元素的属性参数与所述预设存储单元的映射关系,将所述第三日志文件存储至所述预设存储单元的数据。6.根据权利要求1所述的网站数据采集方法,其特征在于,所述网站数据采集方法,还包括:获取第三访问请求信息,所述第三访问请求信息为描述前端的所述网站向后端所述微服务器请求访问的信息;基于所述第三访问请求信息,得到第一路由信息,所述第一路由信息为从所述网站的IP地址到所述微服务器的IP地址的进程;判断所述第一路由信息是否在第二路由信息内,所述第二路由信息中至少包括两个自定义的预设路由,每个所述预设路由为从访问IP地址到目标访问IP地址的进程;若是,则响应于所述第三访问请求信息,得到第四日志文件,所述第四日志文件为所述微服务器的基本属性信息;根据所述第四日志文件和所述预设存储单元,得到网站数据信息,所述网站数据信息是根据所述预设存储单元与所述微服务器的基本属性信息的映射关系,将所述第四日志文件分别存储至所述预设存储单元的数据。7.一种网站数据采集装置,其特征在于,包括:获取模块:用于获取第一服务请求信息以及所述第一服务请求信息对应的第一时间信息,所述第一服务请求信息为描述网站前端请求调用后端微服务器接口的信息;提取模块:用于根据所述第一服务请求信息,得到第一关键参数,所述第一关键参数为从所述第一服务请求信息中解析提取的关键字段信息;集合模块:用于根据所述第一时间信息和所述第一关键参数,得到用户数据信息,所述用户数据...
【专利技术属性】
技术研发人员:唐存雨,
申请(专利权)人:中信银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。