基于大数据的互联网数据分析方法及系统技术方案

技术编号:36943528 阅读:55 留言:0更新日期:2023-03-22 19:05
本公开提供的基于大数据的互联网数据分析方法及系统,对需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行再次分析,生成最终分析结果。本公开通过若干种分析方法逐一对需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行分析处理,生成若干个第一分析结果;对若干个第一分析结果进行优化确定各目标互联网交互数据的当前互动标签簇,基于目标互联网交互数据的当前互动标签簇对需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行再次分析,能够提高需要进行分析处理的互联网交互数据簇中目标互联网交互数据的分析结果的精确性和可靠性。靠性。靠性。

【技术实现步骤摘要】
基于大数据的互联网数据分析方法及系统


[0001]本申请涉及数据分析
,具体而言,涉及基于大数据的互联网数据分析方法及系统。

技术介绍

[0002]数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
[0003]现目前,大数据与互联网数据分析技术相结合时,由于数据分析技术不够完善,可能存在不能准确地对互联网交互数据进行准确且可靠地分析。因此,难以保障目标互联网交互数据的分析结果的精确性和可靠性。

技术实现思路

[0004]为改善相关技术中存在的技术问题,本公开提供了基于大数据的互联网数据分析方法及系统。
[0005]第一方面,提供一种基于大数据的互联网数据分析方法,应用于数据分析系统,所述方法至少包括:获得需要进行分析处理的互联网交互数据簇,所述需要进行分析处理的互联网交互数据簇包括若干个目标互联网交互数据;基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果;结合所述不少于两种分析方法逐一对应的所述第一分析结果,确定各所述目标互联网交互数据的当前互动标签簇;通过各所述目标互联网交互数据的当前互动标签簇,对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行再次分析,生成最终分析结果。
[0006]在一种独立实施的实施例中,所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果,包括:对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行随机识别,生成不少于两个局部交互数据簇;根据所述不少于两种分析方法逐一对各所述局部交互数据簇中的目标互联网交互数据进行预分析,生成各所述分析方法与各所述局部交互数据簇之间逐一对应的所述第一分析结果。
[0007]在一种独立实施的实施例中,所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果,之前还包括:对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行知识推导信息挑选,生成所述目标互联网交互数据的第一知识推导信息;将各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息;所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分
析,生成所述不少于两种分析方法逐一对应的第一分析结果,包括:利用所述不少于两种分析方法,通过各所述目标互联网交互数据的第二知识推导信息逐一对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果。
[0008]在一种独立实施的实施例中,所述将各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息,包括:采用主分量分析方法逐一对各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息。
[0009]在一种独立实施的实施例中,所述结合所述不少于两种分析方法逐一对应的所述第一分析结果,确定各所述目标互联网交互数据的当前互动标签簇,包括:遍历所述需要进行分析处理的互联网交互数据簇中各所述目标互联网交互数据,基于筛选的所述目标互联网交互数据与所述需要进行分析处理的互联网交互数据簇中剩余所述目标互联网交互数据之间的共性评分,确定所述筛选的目标互联网交互数据对应的邻居互联网交互数据簇,所述邻居互联网交互数据簇包括与所述筛选的目标互联网交互数据的所述共性评分最大的指定数目个邻居互联网交互数据;结合所述目标互联网交互数据的邻居互联网交互数据簇和所述不少于两种分析方法逐一对应的第一分析结果,确定所述目标互联网交互数据的当前互动标签簇,所述当前互动标签簇为所述邻居互联网交互数据簇的阶段化集合。
[0010]在一种独立实施的实施例中,所述结合所述目标互联网交互数据的邻居互联网交互数据簇和所述不少于两种分析方法逐一对应的第一分析结果,确定所述目标互联网交互数据的当前互动标签簇,包括:结合所述目标互联网交互数据与所述邻居互联网交互数据在所述第一分析结果中的可信权重,确定所述目标互联网交互数据与所述邻居互联网交互数据是否属于相同标签;结合所述邻居互联网交互数据簇中与所述目标互联网交互数据属于相同标签的所述邻居互联网交互数据,确定所述目标互联网交互数据的当前互动标签簇。
[0011]在一种独立实施的实施例中,所述第一分析结果包括所述需要进行分析处理的互联网交互数据簇中涵盖的所述目标互联网交互数据的分析方式;所述结合所述目标互联网交互数据与所述邻居互联网交互数据在所述第一分析结果中的可信权重,确定所述目标互联网交互数据与所述邻居互联网交互数据是否属于相同标签,包括:在所述目标互联网交互数据对应的所述邻居互联网交互数据簇中筛选一所述邻居互联网交互数据;在全部所述第一分析结果中,确定得到同时涵盖所述目标互联网交互数据和所述筛选的邻居互联网交互数据的所述第一分析结果的数量为第一数目;在同时涵盖所述目标互联网交互数据和所述筛选的邻居互联网交互数据的全部所述第一分析结果中,确定得到所述目标互联网交互数据的分析方式和所述筛选的邻居互联网交互数据的分析方式相同的所述第一分析结果的数量为第二数目;结合所述第二数目在所述第一数目中的可信权重,确定所述目标互联网交互数据与所述筛选的邻居互联网交互数据是否属于相同标签。
[0012]在一种独立实施的实施例中,所述结合所述第二数目在所述第一数目中的可信权重,确定所述筛选的目标互联网交互数据与所述邻居互联网交互数据是否属于相同标签,包括:响应于所述第二数目在所述第一数目中的可信权重超过指定向量,确定所述目标互联网交互数据与所述筛选的邻居互联网交互数据属于相同标签;响应于所述第二数目在所
述第一数目中的可信权重不大于所述指定向量,确定所述目标互联网交互数据与所述筛选的邻居互联网交互数据不属于相同标签。
[0013]在一种独立实施的实施例中,所述通过各所述目标互联网交互数据的当前互动标签簇,对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行再次分析,生成最终分析结果,包括:通过各所述目标互联网交互数据的当前互动标签簇,确定随机两个所述目标互联网交互数据之间的关联性;基于随机两个所述目标互联网交互数据之间的关联性,将所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据辨别为不少于一个标签互联网交互数据簇;所述标签互联网交互数据簇中包括所述关联性超过关联性目标值的不少于两个所述目标互联网交互数据;对所述不少本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的互联网数据分析方法,其特征在于,应用于数据分析系统,所述方法至少包括:获得需要进行分析处理的互联网交互数据簇,所述需要进行分析处理的互联网交互数据簇包括若干个目标互联网交互数据;基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果;结合所述不少于两种分析方法逐一对应的所述第一分析结果,确定各所述目标互联网交互数据的当前互动标签簇;通过各所述目标互联网交互数据的当前互动标签簇,对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行再次分析,生成最终分析结果。2.如权利要求1所述的基于大数据的互联网数据分析方法,其特征在于,所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果,包括:对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行随机识别,生成不少于两个局部交互数据簇;根据所述不少于两种分析方法逐一对各所述局部交互数据簇中的目标互联网交互数据进行预分析,生成各所述分析方法与各所述局部交互数据簇之间逐一对应的所述第一分析结果。3.如权利要求1或2所述的基于大数据的互联网数据分析方法,其特征在于,所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果,之前还包括:对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行知识推导信息挑选,生成所述目标互联网交互数据的第一知识推导信息;将各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息;所述基于不少于两种分析方法逐一对所述需要进行分析处理的互联网交互数据簇中的目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果,包括:利用所述不少于两种分析方法,通过各所述目标互联网交互数据的第二知识推导信息逐一对所述需要进行分析处理的互联网交互数据簇中的所述目标互联网交互数据进行预分析,生成所述不少于两种分析方法逐一对应的第一分析结果。4.如权利要求3所述的基于大数据的互联网数据分析方法,其特征在于,所述将各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息,包括:采用主分量分析方法逐一对各所述目标互联网交互数据的第一知识推导信息分别进行简化处理,生成各所述目标互联网交互数据的第二知识推导信息。5.如权利要求1所述的基于大数据的互联网数据分析方法,其特征在于,所述结合所述不少于两种分析方法逐一对应的所述第一分析结果,确定各所述目标互联网交互数据的当前互动标签簇,包括:
遍历所述需要进行分析处理的互联网交互数据簇中各所述目标互联网交互数据,基于筛选的所述目标互联网交互数据与所述需要进行分析处理的互联网交互数据簇中剩余所述目标互联网交互数据之间的共性评分,确定所述筛选的目标互联网交互数据对应的邻居互联网交互数据簇,所述邻居互联网交互数据簇包括与所述筛选的目标互联网交互数据的所述共性评分最大的指定数目个邻居互联网交互数据;结合所述目标互联网交互数据的邻居互联网交互数据簇和所述不少于两种分析方法逐一对应的第一分析结果,确定所述目标互联网交互数据的当前互动标签簇,所述当前互动标签簇为所述邻居互联网交互数据簇的阶段化集合。6.如权利要求5所述的基于大数据的互联网数据分析方法,其特征在于,所述结合所述目标互联网交互数据的邻居互联网交互数据簇和所述不少于两种分析方法逐一对应的第一分析结果,确定所述目标互联网交互数据的当前互动标签簇,包括:结合所述目标互联网交互数据与所述邻居互联网交互数据在所述第一分析结果中的可信权重,确定所述目标互联网交互数据与所述邻居互联网交互数据是否属于相同标签;结合所述邻居互联网交互数据簇中与所述目标互联网交互数据属于相同标签的所述邻居互联网交互数据,确定所述目标互联网交互数据的当前互动标签簇。7.如权利要求6所述的基于大数据的互联网数据分析方法,其特征在于,所述第一分析结果包括所述需要进行分析处理的互联网交互数据簇中涵盖的所述目标互联网交互数据的分析方式;所述结合所述目标互联网交互数据与所述邻居互联网交互数据在所述第一分析结果中的可信权重,确定所述目标互联网交互数据与所述邻居互联网交互数据是否属于相同标签,包括:在所述目标互联网交互数据对应的所述邻居互联网交互数据簇中筛选一所述邻居互联网交互数据;在全部所述第一分析结果中,确定得到同时涵盖所述目标互联网交互数据和所述筛选的邻居互联网交互数据的所述第一分析结果的数量为第一数目;在同时涵盖所述目标互联网交互数据和所述筛选的邻居互联网交互数据的全部所述第一分析结果中,确定得到所述目标互联网交互数据的分析方式和所述筛选的邻居互联网交互数据的分析方式相同的所述第一分析结果的数量为第二数目;结合所述第二数目在所述第一数目中的可信权重,确定所述目标互联网交互数据与所述筛选的邻居互联网交互数...

【专利技术属性】
技术研发人员:丁浩冉王梦琦
申请(专利权)人:徐州海清信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1