【技术实现步骤摘要】
基于互联网热点话题的大数据处理方法及系统
[0001]本公开涉及大数据
,尤其涉及一种基于互联网热点话题的大数据处理方法及系统。
技术介绍
[0002]当下,互联网的迅猛发展与大面积普及,使得海量数据的获取、存储、传输、处理和分析等变得越来越便捷。结合大数据的话题分析技术能够从海量的数据信息中挖掘出隐藏的数字资产价值,从而帮助各行业的良性发展。对于话题分析而言,热点话题捕捉是关键点之一,随着话题大数据规模和类似的不断激增,传统的话题捕捉技术已难以满足相关需求,比如难以保障话题捕捉的精度和可靠性。因此,亟需一种技术方案来改善上述问题。
技术实现思路
[0003]本公开的一个目的是提供一种基于互联网热点话题的大数据处理方法及系统。
[0004]本公开的技术方案是通过如下至少部分实施例实现的。
[0005]一种基于互联网热点话题的大数据处理方法,其中,所述方法通过大数据处理系统实施,所述方法至少包括:依次对第一互联网社交互动数据以及第二互联网社交互动数据进行在线话题解析,获得第一互联网社交互动数据中第一候选热点话题的第一待处理社交互动数据集和第二互联网社交互动数据中第二候选热点话题的第二待处理社交互动数据集;基于第一待处理社交互动数据集和第二待处理社交互动数据集在话题细节层面进行热点话题联合分析,获得第一联合分析结果,并基于第一待处理社交互动数据集和第二待处理社交互动数据集在话题场景层面进行热点话题联合分析,获得第二联合分析结果;整理第一联合分析结果和第二联合分析结果,获得话题捕捉结果 ...
【技术保护点】
【技术特征摘要】
1.一种基于互联网热点话题的大数据处理方法,其中,所述方法通过大数据处理系统实施,所述方法至少包括:依次对第一互联网社交互动数据以及第二互联网社交互动数据进行在线话题解析,获得所述第一互联网社交互动数据中第一候选热点话题的第一待处理社交互动数据集和所述第二互联网社交互动数据中第二候选热点话题的第二待处理社交互动数据集;结合所述第一待处理社交互动数据集和所述第二待处理社交互动数据集在话题细节层面进行热点话题联合分析,获得第一联合分析结果,并结合所述第一待处理社交互动数据集和所述第二待处理社交互动数据集在话题场景层面进行热点话题联合分析,获得第二联合分析结果;以及,整理所述第一联合分析结果和所述第二联合分析结果,获得话题捕捉结果;其中,所述话题捕捉结果包含所述第一候选热点话题与所述第二候选热点话题是否为相同候选热点话题。2.如权利要求1所述的方法,其中,所述结合所述第一待处理社交互动数据集和所述第二待处理社交互动数据集在话题细节层面进行热点话题联合分析,获得第一联合分析结果,包括:依次通过各所述第一候选热点话题的所述第一待处理社交互动数据集,挖掘获得各所述第一候选热点话题的第一话题细节内容描述,并依次通过各所述第二候选热点话题的所述第二待处理社交互动数据集,挖掘获得各所述第二候选热点话题的第二话题细节内容描述;借助所述第一话题细节内容描述和所述第二话题细节内容描述,获得各所述第一候选热点话题与各所述第二候选热点话题之间的细节共性指数;依据各所述第一候选热点话题与各所述第二候选热点话题之间的细节共性指数,获得所述第一联合分析结果。3.如权利要求2所述的方法,其中,所述第一话题细节内容描述或所述第二话题细节内容描述的挖掘实现方式包括:经由待处理社交互动数据集中每个社交互动信息的词向量标签,确定话题区分约束信息;其中,所述话题区分约束信息为所述待处理社交互动数据集所对应的候选热点话题的约束语义;基于所述话题区分约束信息从所述待处理社交互动数据集中提取得到局部社交互动数据簇;结合所述局部社交互动数据簇进行话题细节挖掘,获得所述所对应的候选热点话题的话题细节内容描述;其中,在所述待处理社交互动数据集为所述第一待处理社交互动数据集的条件下,所述所对应的候选热点话题为所述第一候选热点话题,所述话题细节内容描述为所述第一话题细节内容描述,在所述待处理社交互动数据集为所述第二待处理社交互动数据集的条件下,所述所对应的候选热点话题为所述第二候选热点话题,所述话题细节内容描述为所述第二话题细节内容描述。4.如权利要求1所述的方法,其中,所述结合所述第一待处理社交互动数据集和所述第二待处理社交互动数据集在话题场景层面进行热点话题联合分析,获得第二联合分析结果,包括:借助所述第二互联网社交互动数据对所述第一互联网社交互动数据进行活动变化分
析,获得所述第一互联网社交互动数据的社交活动变化数据;结合所述社交活动变化数据,对所述第一候选热点话题的第一待处理社交互动数据集进行分治化解析,获得所述第一候选热点话题在所述第二互联网社交互动数据的捕捉节点的测试型社交互动数据集;依据每个所述第一候选热点话题的测试型社交互动数据集分别与每个所述第二候选热点话题的第二待处理社交互动数据集之间的异同解析结果,获得所述第二联合分析结果。5.如权利要求4所述的方法,其中,所述结合所述社交活动变化数据,对所述第一候选热点话题的第一待处理社交互动数据集进行分治化解析,获得所述第一候选热点话题在所述第二互联网社交互动数据的捕捉节点的测试型社交互动数据集,包括:将所述社交活动变化数据和所述第一待处理社交互动数据集进行基于社交互动信息的加权处理,获得所述第一待处理社交互动数据集中社交互动信息的活动状态指数;将所述第一待处理社交互动数据集中所述社交互动信息的第一信息分布指数与所述活动状态指数求和,获得所述社交互动信息在所述捕捉节点的第二信息分布指数;结合所述第一待处理社交互动数据集中所述社交互动信息的第二信息分布指数,获得所述测试型社交互动数据集。6.如权利要求1所述的方法,其中,所述第一联合分析结果包含所述第一候选热点话题与所述第二候选热点话题之间的第一联合评价值,所述第二联合分析结果包含所述第一候选热点话题与所述第二候选热点话题之间的第二联合评价值,所述整理所述第一联合分析结果和所述第二联合分析结果,获得话题捕捉结果,包括:对所述第一联合分析结果中所述第一联合评价值进行动态优化,获得第一已优化联合分析结果,并对所述第二联合分析结果中所述第二联合评价值进行动态优化,获得第二已优化联合分析结果;其中,所述第一已优化联合分析结果包含所述第一候选热点话题与所述第二候选热点话题之间的第一已优化联合评...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。