基于人工智能的大数据挖掘方法及系统技术方案

技术编号:36088001 阅读:17 留言:0更新日期:2022-12-24 11:04
本申请实施例公开的基于人工智能的大数据挖掘方法及系统,能够规避流程性的、没有实质性用户行为内容的用户行为大数据对后续用户行为大数据分析过程产生的干扰,并将目标行为大数据加载至用户兴趣挖掘网络中;基于此,改善了传统方案中,数字虚拟空间交互日志信噪比较低,不便于后续用户行为大数据分析等问题,这样一来,能够通过数据质量更优的数字虚拟空间交互日志实现更为精准可靠的用户兴趣挖掘,提高针对用户行为大数据的分析时效性。提高针对用户行为大数据的分析时效性。提高针对用户行为大数据的分析时效性。

【技术实现步骤摘要】
基于人工智能的大数据挖掘方法及系统


[0001]本申请涉及大数据
,尤其涉及一种基于人工智能的大数据挖掘方法及系统。

技术介绍

[0002]人工智能(AI)在大数据分析中的重要性不言而喻。元宇宙、数字空间服务等新一代前言技术的发展对大数据分析带来了不小的挑战。传统的大数据分析技术,例如用户兴趣挖掘,已难以从容应对元宇宙、数字空间服务这些领域。专利技术人经研究和分析发现,传统的用户兴趣挖掘技术在应用到元宇宙、数字空间服务这些领域时容易受到干扰,难以确保用户兴趣挖掘的精度和时效性。

技术实现思路

[0003]本申请的一个目的是提供一种基于人工智能的大数据挖掘方法及系统。
[0004]一种基于人工智能的大数据挖掘方法,应用于大数据挖掘系统,所述方法包括:获得设定数目的数字虚拟空间交互日志的用户行为大数据,其中,所述设定数目大于第一设定限值;确定所述用户行为大数据的用户行为表达向量,并利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网,其中,所述行为联动关系网中涵盖了多个关系活动成员,所述多个关系活动成员中的各关系活动成员涵盖了所述用户行为大数据的一组或多组用户行为大数据,以及所述一组或多组用户行为大数据的分组编号;获得所述行为联动关系网中的各关系活动成员对应的用户行为大数据的拆解指示,并利用所述各关系活动成员的拆解指示对所述各关系活动成员的用户行为大数据进行数据拆解,以得到所述行为联动关系网中全部关系活动成员的待处理行为数据集;从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据,并将所述目标行为大数据加载至用户兴趣挖掘网络中。
[0005]可选的,利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网的过程中,所述方法包括:对于所述多组用户行为大数据的任一组用户行为大数据,确定所述任一组用户行为大数据的第一分组编号;对比所述第一分组编号和所述任一组用户行为大数据的上一组用户行为大数据的关系活动成员的第二分组编号;根据对比结果确定是否在所述行为联动关系网中增添下游活动成员;其中,确定所述任一组用户行为大数据的第一分组编号,包括:确定所述任一组用户行为大数据中全部信息块的分组编号;从所述全部信息块的分组编号中确定存在次数最多的分组编号,并将所述存在次数最多的分组编号作为所述第一分组编号;其中,根据对比结果确定是否在所述行为联动关系网中增添下游活动成员,包括:在所述第一分组编号大于所述第二分组编号的基础上,在所述行为联动关系网中检索除所述任一组用户行为大数据的关系活动成员和上一组用户行为大数据的关系活动成员以外
的剩余关系活动成员,以从所述剩余关系活动成员中确定目标关系活动成员的第三分组编号大于所述第一分组编号,为所述目标关系活动成员增添下游活动成员,并将所述任一组用户行为大数据记录于所述目标关系活动成员增添的下游活动成员中;在所述第一分组编号等于所述第二分组编号的基础上,将所述任一组用户行为大数据记录于所述上一组用户行为大数据的关系活动成员;在所述第一分组编号小于所述第二分组编号的基础上,为所述任一组用户行为大数据的关系活动成员增添下游活动成员,并将所述任一组用户行为大数据记录于所述任一组用户行为大数据的关系活动成员增添的下游活动成员中。
[0006]可选的,获得所述行为联动关系网中的各关系活动成员对应的用户行为大数据的拆解指示之前,所述方法还包括:通过如下步骤获得所述行为联动关系网中全部关系活动成员的用户行为大数据:依次访问所述全部关系活动成员,以确定全部关系活动成员中存在次数最多的第四分组编号,将所述第四分组编号所对应的用户行为大数据作为所述全部关系活动成员的用户行为大数据的核心内容;将大于所述第四分组编号的第五分组编号所对应的用户行为大数据作为所述全部关系活动成员的用户行为大数据的关键特征;其中,通过如下步骤获得所述行为联动关系网中全部关系活动成员的用户行为大数据之后,所述方法还包括以下至少之一:从所述全部关系活动成员的用户行为大数据中确定小于所述第四分组编号的关系活动成员,清洗掉所述小于所述第四分组编号的关系活动成员对应的用户行为大数据;通过第一专家系统算法从所述全部关系活动成员的用户行为大数据中确定被拆分的视觉内容块,将被拆分的视觉内容块进行组合,得到组合后的视觉内容块,其中,在云共享存储空间中查找到所述组合后的用户行为大数据的基础上,确定所述组合后的视觉内容块为一个行为数据项。
[0007]可选的,从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据,包括:确定所述全部关系活动成员的全部待处理行为数据集的可信评分;将可信评分大于第二设定限值的待处理行为数据集从所述全部待处理行为数据集中清洗掉,得到待处理行为数据队列;从所述待处理行为数据队列中挖掘出携带反馈情绪特征的目标行为大数据;其中,将可信评分大于第二设定限值的待处理行为数据集从所述全部待处理行为数据集中清洗掉,得到待处理行为数据队列之后,所述方法还包括:在所述待处理行为数据队列中存在可视化图文数据集的基础上,利用所述可视化图文数据集中的设定信息块对所述可视化图文数据集进行拆解,得到多个数据单元;在所述多个数据单元的数目小于第三设定限值的基础上,确定所述可视化图文数据集不是携带反馈情绪特征的数据集;在所述多个数据单元的数目大于第三设定限值的基础上,确定携带反馈情绪特征的行为数据项在所述多个数据单元中的比例;在所述比例大于第四设定限值的基础上,确定所述可视化图文数据集是携带反馈情绪特征的数据集。
[0008]可选的,从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据的过程中,所述方法还包括:确定所述待处理行为数据集中不存在反馈情绪特征的行为信息链;按照所述行为信息链的种类将所述不存在反馈情绪特征的行为信息链变更为携
带反馈情绪特征的行为数据项;利用所述携带反馈情绪特征的行为数据项调整所述待处理行为数据集。
[0009]一种大数据挖掘系统,所述大数据挖掘系统与数字用户终端通信连接,所述大数据挖掘系统用于:获得设定数目的数字虚拟空间交互日志的用户行为大数据,其中,所述设定数目大于第一设定限值;确定所述用户行为大数据的用户行为表达向量,并利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网,其中,所述行为联动关系网中涵盖了多个关系活动成员,所述多个关系活动成员中的各关系活动成员涵盖了所述用户行为大数据的一组或多组用户行为大数据,以及所述一组或多组用户行为大数据的分组编号;获得所述行为联动关系网中的各关系活动成员对应的用户行为大数据的拆解指示,并利用所述各关系活动成员的拆解指示对所述各关系活动成员的用户行为大数据进行数据拆解,以得到所述行为联动关系网中全部关系活动成员的待处理行为数据集;从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据,并将所述目标行为大数据加载至用户兴趣挖掘网络中。
[0010]可选的,利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网的过程中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的大数据挖掘方法,其特征在于,应用于大数据挖掘系统,所述方法包括:获得设定数目的数字虚拟空间交互日志的用户行为大数据,其中,所述设定数目大于第一设定限值;确定所述用户行为大数据的用户行为表达向量,并利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网,其中,所述行为联动关系网中涵盖了多个关系活动成员,所述多个关系活动成员中的各关系活动成员涵盖了所述用户行为大数据的一组或多组用户行为大数据,以及所述一组或多组用户行为大数据的分组编号;获得所述行为联动关系网中的各关系活动成员对应的用户行为大数据的拆解指示,并利用所述各关系活动成员的拆解指示对所述各关系活动成员的用户行为大数据进行数据拆解,以得到所述行为联动关系网中全部关系活动成员的待处理行为数据集;从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据,并将所述目标行为大数据加载至用户兴趣挖掘网络中。2.根据权利要求1所述的基于人工智能的大数据挖掘方法,其特征在于,利用所述用户行为表达向量生成所述用户行为大数据的行为联动关系网的过程中,所述方法包括:对于所述多组用户行为大数据的任一组用户行为大数据,确定所述任一组用户行为大数据的第一分组编号;对比所述第一分组编号和所述任一组用户行为大数据的上一组用户行为大数据的关系活动成员的第二分组编号;根据对比结果确定是否在所述行为联动关系网中增添下游活动成员;其中,确定所述任一组用户行为大数据的第一分组编号,包括:确定所述任一组用户行为大数据中全部信息块的分组编号;从所述全部信息块的分组编号中确定存在次数最多的分组编号,并将所述存在次数最多的分组编号作为所述第一分组编号;其中,根据对比结果确定是否在所述行为联动关系网中增添下游活动成员,包括:在所述第一分组编号大于所述第二分组编号的基础上,在所述行为联动关系网中检索除所述任一组用户行为大数据的关系活动成员和上一组用户行为大数据的关系活动成员以外的剩余关系活动成员,以从所述剩余关系活动成员中确定目标关系活动成员的第三分组编号大于所述第一分组编号,为所述目标关系活动成员增添下游活动成员,并将所述任一组用户行为大数据记录于所述目标关系活动成员增添的下游活动成员中;在所述第一分组编号等于所述第二分组编号的基础上,将所述任一组用户行为大数据记录于所述上一组用户行为大数据的关系活动成员;在所述第一分组编号小于所述第二分组编号的基础上,为所述任一组用户行为大数据的关系活动成员增添下游活动成员,并将所述任一组用户行为大数据记录于所述任一组用户行为大数据的关系活动成员增添的下游活动成员中。3.根据权利要求1所述的基于人工智能的大数据挖掘方法,其特征在于,获得所述行为联动关系网中的各关系活动成员对应的用户行为大数据的拆解指示之前,所述方法还包括:通过如下步骤获得所述行为联动关系网中全部关系活动成员的用户行为大数据:依次访问所述全部关系活动成员,以确定全部关系活动成员中存在次数最多的第四分组编号,将所述第四分组编号所对应的用户行为大数据作为所述全部关系活动成员的用户行为大数据的核心内容;将大于所述第四分组编号的第五分组编号所对应的用户行为大数据作为所述全部关系活动成员的用户行为大数据的关键特征;
其中,通过如下步骤获得所述行为联动关系网中全部关系活动成员的用户行为大数据之后,所述方法还包括以下至少之一:从所述全部关系活动成员的用户行为大数据中确定小于所述第四分组编号的关系活动成员,清洗掉所述小于所述第四分组编号的关系活动成员对应的用户行为大数据;通过第一专家系统算法从所述全部关系活动成员的用户行为大数据中确定被拆分的视觉内容块,将被拆分的视觉内容块进行组合,得到组合后的视觉内容块,其中,在云共享存储空间中查找到所述组合后的用户行为大数据的基础上,确定所述组合后的视觉内容块为一个行为数据项。4.根据权利要求1所述的基于人工智能的大数据挖掘方法,其特征在于,从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据,包括:确定所述全部关系活动成员的全部待处理行为数据集的可信评分;将可信评分大于第二设定限值的待处理行为数据集从所述全部待处理行为数据集中清洗掉,得到待处理行为数据队列;从所述待处理行为数据队列中挖掘出携带反馈情绪特征的目标行为大数据;其中,将可信评分大于第二设定限值的待处理行为数据集从所述全部待处理行为数据集中清洗掉,得到待处理行为数据队列之后,所述方法还包括:在所述待处理行为数据队列中存在可视化图文数据集的基础上,利用所述可视化图文数据集中的设定信息块对所述可视化图文数据集进行拆解,得到多个数据单元;在所述多个数据单元的数目小于第三设定限值的基础上,确定所述可视化图文数据集不是携带反馈情绪特征的数据集;在所述多个数据单元的数目大于第三设定限值的基础上,确定携带反馈情绪特征的行为数据项在所述多个数据单元中的比例;在所述比例大于第四设定限值的基础上,确定所述可视化图文数据集是携带反馈情绪特征的数据集。5.根据权利要求1所述的基于人工智能的大数据挖掘方法,其特征在于,从所述全部关系活动成员的待处理行为数据集挖掘出携带反馈情绪特征的目标行为大数据的过程中,所述方法还包括:确定所述待处理行为数据集中不存在反馈情绪特征的行为信息链;按照所述行为信息链的种类将所述不存在反馈情绪特征的行为信息链变更为携带反馈情绪特征的行为数据项;利用所述携带反馈情绪特征的行为数据项调整所述待处理行为数据集。6.一种大数据挖掘系统...

【专利技术属性】
技术研发人员:季银蒋杰
申请(专利权)人:江苏永硕舟钰数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1