一种基于集约化网站大数据分析平台制造技术

技术编号:25397293 阅读:18 留言:0更新日期:2020-08-25 23:02
本发明专利技术公开了一种基于集约化网站大数据分析平台,包括用户登录单元、身份库、显示单元、处理器、数据抓取单元、个人惯性库、偏向数据分析单元、数据收集单元和数据暂存单元;本发明专利技术通过用户登录单元结合处理器以及身份库,对用户的身份进行识别之后,还会通过本发明专利技术公开的相关保护算法,对用户设备的合法性进行验证,具体通过特性信息这一关键因素进行分析了解;只有在两者均通过时,才能保证用户进行正常的数据访问;之后借助偏向数据分析单元用于对数据暂存单元内存储的访问信息组及其对应的身份信息进行数据分析,得到用户的次序访问信息;之后处理器用于结合个人惯性库内的次序访问信息以及数据抓取单元对身份信息进行信息推荐。

【技术实现步骤摘要】
一种基于集约化网站大数据分析平台
本专利技术属于大数据分析领域,具体是涉及一种基于集约化网站大数据分析平台。
技术介绍
公开号为CN109392196A的专利公开了一种基于移动终端的大数据分析方法及系统,大数据分析方法包括如下步骤:由移动终端收集指定类型的用户信息;由移动终端向大数据分析中心发送传输信道建立请求消息;如果移动终端在第一定时器超时之前没有接收到传输信道建立响应消息,也没有接收到传输信道建立否定消息,则由移动终端立即重新向大数据分析中心发送传输信道建立请求消息;如果移动终端在第一定时器超时之前接收到传输信道建立否定消息,则由移动终端在等待第一时间之后,重新向大数据分析中心发送传输信道建立请求消息;如果移动终端在第一定时器超时之前接收到传输信道建立响应消息,则由移动终端向大数据分析中心发送移动终端的身份标识符。但是其针对网站大数据,没有结合用户身份提供一种有效的数据挖掘系统,能够根据用户习惯进行用户喜欢的热点信息进行推荐,同时结合热点信息的实时热度进行推荐;为了解决这一技术缺陷,现提供一种解决方案。
技术实现思路
本专利技术的目的在于提供一种基于集约化网站大数据分析平台。本专利技术的目的可以通过以下技术方案实现:一种基于集约化网站大数据分析平台,包括用户登录单元、身份库、显示单元、处理器、数据抓取单元、个人惯性库、偏向数据分析单元、数据收集单元和数据暂存单元;其中,所述用户登录单元用于用户录入身份信息及其对应的秘钥信息,所述身份库内存储有核准用户的标准身份信息及其对应的核准秘钥信息;所述用户登录单元用于将身份信息及其对应的秘钥信息传输到处理器,所述处理器用于结合身份库对身份信息、秘钥信息进行设备核实处理,产生通过信号或者设备错误信号;所述处理器在产生设备错误信号时,驱动显示单元显示“所用设备不受信任,请核实”;所述处理器在产生错初信号时,驱动显示单元显示“身份秘钥错误,请核实”;所述处理器用于在产生通过信号时,利用个人惯性库对身份信息进行数据抓取;所述数据收集单元用于收集用户由若干个访问信息构成的访问信息组,访问信息具体为用户在进行网站访问时的访问内容;所述数据收集单元用于将访问信息组结合对应身份信息将其传输到数据暂存单元进行存储;所述偏向数据分析单元用于对数据暂存单元内存储的访问信息组及其对应的身份信息进行数据分析,得到所有的身份信息对应的次序访问信息;所述数据抓取单元与互联网联通,用于实时获取互联网的信息;所述偏向数据分析单元用于将次序访问信息传输到个人惯性库,所述处理器用于结合个人惯性库内的次序访问信息以及数据抓取单元对身份信息进行信息推荐,具体推荐过程为:S100:获取到用户的次序访问信息;S200:获取到排行前三的次序访问信息,获取到对应该三个次序访问信息的关键词;S300:借助数据抓取单元将该关键词在网络上的实时搜索数据调出;具体调出方式为:S301:首先以当下时间为结尾值,获取到当前时间提前一个小时内该关键词的访问次数,将其标记为实时访次;S302:获取到上一个小时内该关键词的访问次数,将其标记为对比次数;S303:当实时访次-对比次数≥X1,X1为预设值;则将该次序访问信息标记为命中访问信息;S400:对下一个次序访问信息的关键词,进行重复步骤三;S500:持续进行步骤S400,直到得到三个命中访问信息,得到信息推荐组;所述处理器用于将信息推荐组传输到显示单元,显示单元接收处理器传输的信息推荐组并进行实时显示。进一步地,核实处理的具体处理过程为:步骤一:首先将身份信息与标准身份信息进行比对,找到与身份信息一致的标准身份信息,之后找到对应的标准秘钥信息;步骤二:将标准秘钥信息与秘钥信息进行比对,若比对一致则产生初通信号;否则产生错初信号;步骤三:在产生初通信号后,将身份信息和秘钥信息组合形成登陆字符组;步骤四:得到登陆字符组之后,结合键入总时长进行选值确认,具体确认方式为,将键入总时长各个位数上的数值相加,得到和值之后取其个位数值,将该数值标记为间值;步骤五:获取到登陆字符组,从第一个数字开始数到第间值个数字,将该数字标记为第一特字;步骤六:去除该第一特字,重复步骤五,获取到剩余登陆字符组的第二特字;步骤七:重复步骤六,得到第三特字;第一特字、第二特字和第三特字构成特性信息;步骤八:管理员核准的用户登录单元,在键入完成身份信息及其对应秘钥信息之后,也会按照步骤三到步骤七的方式得到特性信息,并将该特性信息标记为潜在特性信息;步骤九:只有当潜在特性信息和特性信息一致时,才会产生通过信号;否则产生设备错误信号。进一步地,数据分析的具体过程为:S01:任选一身份信息,获取到其近T1时间内用户的访问信息组,T1为预设值;S02:将访问信息组内的访问信息标记为Fi,i=1...n;S03:获取到对应访问信息的访问次数,访问一次指代用户访问任一信息中断后T2时间内没有继续进行访问,T2为预设值;将对应访问信息的访问次数标记为Ci,i=1...n;S04:获取到对应用户最后一次访问该访问信息Fi距离当下的时间,将该时间标记为时距Gi,i=1...n;S05:利用公式计算兴值Qi,Qi=0.582*Ci+0.418*Gi;S06:按照Qi从大到小的顺序对应的访问信息Fi进行排序整理,得到次序访问信息;S07:选择下一身份信息,并重复步骤S01-S07,直到对所有的身份信息处理完成。进一步地,将身份信息和秘钥信息组合形成登陆字符组的具体组合方式为:S1:获取到从开始键入登陆信息开始计时,直到秘钥信息录入完成结束计时,得到键入总时长,键入总时长量纲为秒;S2:获取到键入总时长的个位数值,将该数值标记为影值;S3:当影值为奇数时,则按照登陆信息+秘钥信息的方式组成登陆字符组;否则,则按照秘钥信息+登陆信息的方式组成登陆字符组。本专利技术的有益效果:本专利技术通过用户登录单元结合处理器以及身份库,对用户的身份进行识别之后,还会通过本专利技术公开的相关保护算法,对用户设备的合法性进行验证,具体通过特性信息这一关键因素进行分析了解;只有在两者均通过时,才能保证用户进行正常的数据访问;之后借助偏向数据分析单元用于对数据暂存单元内存储的访问信息组及其对应的身份信息进行数据分析,得到用户的次序访问信息;之后处理器用于结合个人惯性库内的次序访问信息以及数据抓取单元对身份信息进行信息推荐,根据对应用户倾向信息的实时热度,来判定具体给用户推送何种信息,方便了用户的快速访问,及时获取自己所需了解的信息;本专利技术简单有效,且易于实用。附图说明为了便于本领域技术人员理解,下面结合附图对本专利技术作进一步的说明。图1为本专利技术的系统框图。具体实施方式如图1所示,一种基于集约化网站大数据分析平台,包括用本文档来自技高网...

【技术保护点】
1.一种基于集约化网站大数据分析平台,其特征在于,包括用户登录单元、身份库、显示单元、处理器、数据抓取单元、个人惯性库、偏向数据分析单元、数据收集单元和数据暂存单元;/n其中,所述用户登录单元用于用户录入身份信息及其对应的秘钥信息,所述身份库内存储有核准用户的标准身份信息及其对应的核准秘钥信息;所述用户登录单元用于将身份信息及其对应的秘钥信息传输到处理器,所述处理器用于结合身份库对身份信息、秘钥信息进行设备核实处理,产生通过信号或者设备错误信号;/n所述处理器在产生设备错误信号时,驱动显示单元显示“所用设备不受信任,请核实”;所述处理器在产生错初信号时,驱动显示单元显示“身份秘钥错误,请核实”;/n所述处理器用于在产生通过信号时,利用个人惯性库对身份信息进行数据抓取;/n所述数据收集单元用于收集用户由若干个访问信息构成的访问信息组,访问信息具体为用户在进行网站访问时的访问内容;所述数据收集单元用于将访问信息组结合对应身份信息将其传输到数据暂存单元进行存储;所述偏向数据分析单元用于对数据暂存单元内存储的访问信息组及其对应的身份信息进行数据分析,得到所有的身份信息对应的次序访问信息;/n所述数据抓取单元与互联网联通,用于实时获取互联网的信息;所述偏向数据分析单元用于将次序访问信息传输到个人惯性库,所述处理器用于结合个人惯性库内的次序访问信息以及数据抓取单元对身份信息进行信息推荐,具体推荐过程为:/nS100:获取到用户的次序访问信息;/nS200:获取到排行前三的次序访问信息,获取到对应该三个次序访问信息的关键词;/nS300:借助数据抓取单元将该关键词在网络上的实时搜索数据调出;具体调出方式为:/nS301:首先以当下时间为结尾值,获取到当前时间提前一个小时内该关键词的访问次数,将其标记为实时访次;/nS302:获取到上一个小时内该关键词的访问次数,将其标记为对比次数;/nS303:当实时访次-对比次数≥X1,X1为预设值;则将该次序访问信息标记为命中访问信息;/nS400:对下一个次序访问信息的关键词,进行重复步骤三;/nS500:持续进行步骤S400,直到得到三个命中访问信息,得到信息推荐组;/n所述处理器用于将信息推荐组传输到显示单元,显示单元接收处理器传输的信息推荐组并进行实时显示。/n...

【技术特征摘要】
1.一种基于集约化网站大数据分析平台,其特征在于,包括用户登录单元、身份库、显示单元、处理器、数据抓取单元、个人惯性库、偏向数据分析单元、数据收集单元和数据暂存单元;
其中,所述用户登录单元用于用户录入身份信息及其对应的秘钥信息,所述身份库内存储有核准用户的标准身份信息及其对应的核准秘钥信息;所述用户登录单元用于将身份信息及其对应的秘钥信息传输到处理器,所述处理器用于结合身份库对身份信息、秘钥信息进行设备核实处理,产生通过信号或者设备错误信号;
所述处理器在产生设备错误信号时,驱动显示单元显示“所用设备不受信任,请核实”;所述处理器在产生错初信号时,驱动显示单元显示“身份秘钥错误,请核实”;
所述处理器用于在产生通过信号时,利用个人惯性库对身份信息进行数据抓取;
所述数据收集单元用于收集用户由若干个访问信息构成的访问信息组,访问信息具体为用户在进行网站访问时的访问内容;所述数据收集单元用于将访问信息组结合对应身份信息将其传输到数据暂存单元进行存储;所述偏向数据分析单元用于对数据暂存单元内存储的访问信息组及其对应的身份信息进行数据分析,得到所有的身份信息对应的次序访问信息;
所述数据抓取单元与互联网联通,用于实时获取互联网的信息;所述偏向数据分析单元用于将次序访问信息传输到个人惯性库,所述处理器用于结合个人惯性库内的次序访问信息以及数据抓取单元对身份信息进行信息推荐,具体推荐过程为:
S100:获取到用户的次序访问信息;
S200:获取到排行前三的次序访问信息,获取到对应该三个次序访问信息的关键词;
S300:借助数据抓取单元将该关键词在网络上的实时搜索数据调出;具体调出方式为:
S301:首先以当下时间为结尾值,获取到当前时间提前一个小时内该关键词的访问次数,将其标记为实时访次;
S302:获取到上一个小时内该关键词的访问次数,将其标记为对比次数;
S303:当实时访次-对比次数≥X1,X1为预设值;则将该次序访问信息标记为命中访问信息;
S400:对下一个次序访问信息的关键词,进行重复步骤三;
S500:持续进行步骤S400,直到得到三个命中访问信息,得到信息推荐组;
所述处理器用于将信息推荐组传输到显示单元,显示单元接收处理器传输的信息推荐组并进行实时显示。


2.根据权利要求1所述的一种基于集约化网站大数据分析平台,其特征在于,核实处理的具体处理过程为:
步骤一:首先将身份信息与标准身份信息进行比对,找到与...

【专利技术属性】
技术研发人员:贺良震戴志龙
申请(专利权)人:安徽龙讯信息科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1