一种基于大数据的数据分析方法技术

技术编号:37526695 阅读:12 留言:0更新日期:2023-05-12 15:51
本发明专利技术提供了一种基于大数据的数据分析方法,包括:获取每个网络业务的业务运行信息建立运行列表;对运行列表进行列处理以及行处理,来获取业务运行展览表;确定对应网络业务的业务访问周期以及访问周期中的访问关键时间点,并构建业务访问展览表;搜集并捕捉针对网络业务的业务日志,确定得到对应网络业务的使用场景集、不同使用场景下的静态信息以及动态信息,构建业务个性展览表;基于所有网络业务的业务运行展览表、业务访问展览表以及业务个性展览表,对相应的网络业务进行同类排序,并进行输出推荐。从三个维度来分别构建对应的展览表,进而实现对同类型网络业务的输出推荐,有效满足用户对相关软件应用的体验感。有效满足用户对相关软件应用的体验感。有效满足用户对相关软件应用的体验感。

【技术实现步骤摘要】
一种基于大数据的数据分析方法


[0001]本专利技术涉及大数据
,特别涉及一种基于大数据的数据分析方法。

技术介绍

[0002]随着物联网络的迅速发展,各种网络业务随之突起,比如,短视频业务、互动直播业务、网络综艺业务、在线游戏业务等,但是由于网络业务杂乱无比,同类型的网络业务所对应的软件应用会存在若干个,由于用户对不同网络业务的认知缺乏,在下载相应的软件应用的过程中,会随机选择相关的进行下载或者是单纯根据人为认知,来对下载量高的软件应用进行下载,在此过程中,并未多方面考虑该软件应用所对应的网络业务是否具备下载价值,也就是后续下载的软件应用并不能很好的满足用户体验。
[0003]因此,本专利技术提出一种基于大数据的数据分析方法。

技术实现思路

[0004]本专利技术提供一种基于大数据的数据分析方法,用以从网络业务的业务运行信息、业务访问信息以及业务日志,三个维度来分别构建对应的展览表,进而实现对同类型网络业务的输出推荐,可以多方面的分析网络业务的存在价值,有效满足用户对相关软件应用的体验感。
[0005]本专利技术提供一种基于大数据的数据分析方法,包括:步骤1:获取每个网络业务的业务运行信息,并建立对应网络业务的运行列表;步骤2:对所述运行列表进行列处理以及行处理,得到相应的特征信息,并从信息

展览映射数据库中获取与所述特征信息一致的业务运行展览表;步骤3:根据对每个网络业务的允许访问方的访问信息,确定对应网络业务的业务访问周期以及访问周期中的访问关键时间点,并构建业务访问展览表;步骤4:搜集并捕捉针对网络业务的业务日志,并对所述业务日志进行解析,确定得到对应网络业务的使用场景集、不同使用场景下的静态信息以及动态信息,基于确定结果,构建得到对应网络业务的业务个性展览表;步骤5:基于所有网络业务的业务运行展览表、业务访问展览表以及业务个性展览表,对相应的网络业务进行同类排序,并进行输出推荐。
[0006]优选的,获取每个网络业务的业务运行信息,并建立对应网络业务的运行列表,包括:监测预先向每个网络业务所分配的业务任务的任务运行过程;获取每个网络业务的业务运行脚本,并对所述业务运行脚本进行脚本解析,得到业务运行块;对每个业务运行块的运行参数的第一描述以及第一标准进行提取;根据提取结果,构建得到对应业务运行块的运行阵列,并构建得到对应网络业务的标准运行数组;
将过程监测结果与标准运行数组进行对应放置处理,获取得到对应网络业务的运行列表。
[0007]优选的,对所述运行列表进行列处理以及行处理,得到相应的特征信息,包括:构建同个运行列表中每个行信息的第一差异集合;其中,表示所述同个运行列表中第j1个行信息的第一差异集合;表示同个运行列表中第j1个行信息中的第i1个运行参数的参数转换系数;表示同个运行列表中第j1个行信息中的第i1个运行参数的实际值;表示同个运行列表中第j1个行信息中的第i1个运行参数的标准值;n1表示所述同个运行列表中第j1个行信息的第一描述的参数个数;从对应第一差异集合中筛选满足的第一主要差异,构建第一差异序列,并从序列

特征映射表中,获取得到对应行信息的第一差异特征;构建同个运行列表中同运行规划点下的列信息的第二差异集合;其中,表示所述同个运行列表中第j2个同运行规划点下的列信息的第二差异集合;表示同个运行列表中第j2个同运行规划点下的列信息中的第i2个运行参数的参数转换系数;表示同个运行列表中第j2个同运行规划点下的列信息中去除延迟所对应的信息后的第i2个运行参数的实际值;表示同个运行列表中第j2个同运行规划点下的列信息中的第i2个运行参数的标准值;n2表示业务运行块的总个数,且与列信息中所包含的运行参数的个数一致;表示对任务运行过程实际监测的过程中,所对应的业务任务是否出现延迟执行,若是,=t;否则,=0;表示对的取整符号;表示同个运行列表中第j2个同运行规划点下的列信息中去除延迟所对应的信息后的第i2+1个运行参数的实际值;从对应第二差异集合中筛选满足的第二主要差异,构建第二差异序列,并从序列

特征映射表中,获取得到对应同运行规划点下的列信息的第二差异特征;基于所述第一差异特征以及第二差异特征,获取得到相应的特征信息。
[0008]优选的,从信息

展览映射数据库中获取与所述特征信息一致的业务运行展览表,包括:根据同个网络业务中每个业务运行块的第一差异特征,从块类型

差异

展览映射数据库中匹配得到对应的第一展览因子;根据同个网络业务中所有业务运行块基于同规划时间点下的第二差异特征,从所
述工作条件

差异

展览映射数据库中匹配得到对应的第二展览因子;将每个第一展览因子与第一标准因子、每个第二展览因子与第二标准因子进行比较,得到同个网络业务的业务运行展览表,其中,所述业务运行展览表包括同业务运行块的运行比较差图以及所有业务运行块在不同规划时间点下的运行比较曲线。
[0009]优选的,根据对每个网络业务的允许访问方的访问信息,确定对应网络业务的业务访问周期以及访问周期中的访问关键时间点,并构建业务访问展览表,包括:将对应允许访问方的访问信息输入到访问分析模型中,获取得到对应允许访问方对所述网络业务的访问频次p1、对应访问时间点的主动访问有效z1以及相关网络业务的反馈有效性y1,并计算同个允许访问方在对应访问时间点下对相应网络业务的访问重要性F;其中,pz表示所有允许访问方对同个网络业务的总访问频次;根据访问重要性,构建同个允许访问方对不同网络业务的第一访问阵列,同时,构建同个网络业务下不同允许访问方的第二访问阵列;基于所述第一访问阵列,计算得到同个允许访问方的用户访问权重;基于所述第二访问阵列,计算得到同个网络业务的业务访问权重;根据对应访问时间点下同个允许访问方主动访问所述同个网络业务后,所获取的业务反馈有效性,与所述同网络业务的业务访问权重以及用户访问权重进行对比分析,若满足时间点筛选条件,则将对应访问时间点作为访问关键时间点;将所有访问关键时间点,构建同个网络业务的访问子表,进而构建得到业务访问展览表。
[0010]优选的,基于所述第一访问阵列,计算得到同个允许访问方的用户访问权重,包括:其中,表示对应第一访问阵列中针对第j3个网络业务的访问重要性的个数;表示对应第一访问阵列中针对第j3个网络业务的访问重要性大于预设重要性的个数;m3表示网络业务的个数;m4表示m3个中满足的个数。
[0011]优选的,基于所述第二访问阵列,计算得到同个网络业务的业务访问权重,包括:其中,n01表示同个网络业务的允许访问方的总个数;表示第i个允许访问方对同个网络业务的访问频次;表示第i个允许访问方第j次访问同个网络业务所对应的访问重要性;表示第i个允许访问方对同个网络业务的最大访问重要性;Y1表示同个网络业务的业务访问权重。
[0012]优选的,对所述业务日志进行解析,确定得到对应网络业务的使用场景集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的数据分析方法,其特征在于,包括:步骤1:获取每个网络业务的业务运行信息,并建立对应网络业务的运行列表;步骤2:对所述运行列表进行列处理以及行处理,得到相应的特征信息,并从信息

展览映射数据库中获取与所述特征信息一致的业务运行展览表;步骤3:根据对每个网络业务的允许访问方的访问信息,确定对应网络业务的业务访问周期以及访问周期中的访问关键时间点,并构建业务访问展览表;步骤4:搜集并捕捉针对网络业务的业务日志,并对所述业务日志进行解析,确定得到对应网络业务的使用场景集、不同使用场景下的静态信息以及动态信息,基于确定结果,构建得到对应网络业务的业务个性展览表;步骤5:基于所有网络业务的业务运行展览表、业务访问展览表以及业务个性展览表,对相应的网络业务进行同类排序,并进行输出推荐。2.根据权利要求1所述的基于大数据的数据分析方法,其特征在于,获取每个网络业务的业务运行信息,并建立对应网络业务的运行列表,包括:监测预先向每个网络业务所分配的业务任务的任务运行过程;获取每个网络业务的业务运行脚本,并对所述业务运行脚本进行脚本解析,得到业务运行块;对每个业务运行块的运行参数的第一描述以及第一标准进行提取;根据提取结果,构建得到对应业务运行块的运行阵列,并构建得到对应网络业务的标准运行数组;将过程监测结果与标准运行数组进行对应放置处理,获取得到对应网络业务的运行列表。3.根据权利要求2所述的基于大数据的数据分析方法,其特征在于,对所述运行列表进行列处理以及行处理,得到相应的特征信息,包括:构建同个运行列表中每个行信息的第一差异集合;其中,表示所述同个运行列表中第j1个行信息的第一差异集合;表示同个运行列表中第j1个行信息中的第i1个运行参数的参数转换系数;表示同个运行列表中第j1个行信息中的第i1个运行参数的实际值;表示同个运行列表中第j1个行信息中的第i1个运行参数的标准值;n1表示所述同个运行列表中第j1个行信息的第一描述的参数个数;从对应第一差异集合中筛选满足的第一主要差异,构建第一差异序列,并从序列

特征映射表中,获取得到对应行信息的第一差异特征;构建同个运行列表中同运行规划点下的列信息的第二差异集合;其中,表示所述同个运行列表中第j2个同运行规划点下的列信息的第二差异集
合;表示同个运行列表中第j2个同运行规划点下的列信息中的第i2个运行参数的参数转换系数;表示同个运行列表中第j2个同运行规划点下的列信息中去除延迟所对应的信息后的第i2个运行参数的实际值;表示同个运行列表中第j2个同运行规划点下的列信息中的第i2个运行参数的标准值;n2表示业务运行块的总个数,且与列信息中所包含的运行参数的个数一致;表示对任务运行过程实际监测的过程中,所对应的业务任务是否出现延迟执行,若是, =t;否则, =0;表示对的取整符号;表示同个运行列表中第j2个同运行规划点下的列信息中去除延迟所对应的信息后的第i2+1个运行参数的实际值;从对应第二差异集合中筛选满足的第二主要差异,构建第二差异序列,并从序列

特征映射表中,获取得到对应同运行规划点下的列信息的第二差异特征;基于所述第一差异特征以及第二差异特征,获取得到相应的特征信息。4.根据权利要求1所述的基于大数据的数据分析方法,其特征在于,从信息

展览映射数据库中获取与所述特征信息一致的业务运行展览表,包括:根据同个网络业务中每个业务运行块的第一差异特征,从块类型

差异

展览映射数据库中匹配得到对应的第一展览因子;根据同个网络业务中所有业务运行块基于同规划时间点下的第二差异特征,从所述工...

【专利技术属性】
技术研发人员:张兵
申请(专利权)人:悦享星光北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1