数据挖掘方法、装置、设备和介质制造方法及图纸

技术编号：38462413 阅读：10 留言：0更新日期：2023-08-11 14:39

本公开提供了一种数据挖掘方法、装置、设备和存储介质，涉及人工智能技术领域，具体涉及大数据、数据分析等技术领域。数据挖掘方法包括：采用第一查询语句，获取原始数据集中目标项的排序结果；采用第二查询语句，调用预设函数，并采用所述预设函数根据所述目标项的排序结果对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果。本公开可以简便地进行数据挖掘处理。挖掘处理。挖掘处理。

全部详细技术资料下载

【技术实现步骤摘要】
数据挖掘方法、装置、设备和介质

[0001]本公开涉及人工智能
，具体涉及计算机视觉、深度学习等
，尤其涉及一种数据挖掘方法、装置、设备和介质。

技术介绍

[0002]频繁模式增长(Frequent Pattern Growth，FP
‑
Growth)算法是一种关联规则挖掘算法。关联规则挖掘算法能够从数据库或其他信息所存储的大量数据中发现频繁项集及其关联性。
[0003]相关技术中，主要基于Python等编程语言自行实现FP
‑
Growth算法，再采用FP
‑
Growth算法挖掘频繁项集及其关联性。

技术实现思路

[0004]本公开提供了一种数据挖掘方法、装置、设备和存储介质。
[0005]根据本公开的一方面，提供了一种数据挖掘方法，包括：采用第一查询语句，获取原始数据集中目标项的排序结果；采用第二查询语句，调用预设函数，并采用所述预设函数根据所述目标项的排序结果对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果。
[0006]根据本公开的另一方面，提供了一种数据挖掘装置，包括：排序模块，用于采用第一查询语句，获取原始数据集中目标项的排序结果；挖掘模块，用于采用第二查询语句，调用预设函数，并采用所述预设函数根据所述目标项的排序结果对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果。
[0007]根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其...

【技术保护点】

【技术特征摘要】
1.一种数据挖掘方法，包括：采用第一查询语句，获取原始数据集中目标项的排序结果；采用第二查询语句，调用预设函数，并采用所述预设函数根据所述目标项的排序结果对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果。2.根据权利要求1所述的方法，其中，所述采用第一查询语句，获取数据集中目标项的排序结果，包括：采用所述第一查询语句，获取所述数据集中目标项的出现次数；采用所述第一查询语句，基于所述出现次数对所述目标项进行排序处理，以获得所述目标项的排序结果。3.根据权利要求2所述的方法，其中，所述第一查询语句包括：分组子句和计数子句；所述采用第一查询语句，获取数据集中目标项的出现次数，包括：采用所述分组子句，将所述数据集中同一个目标项分为同一个分组；采用所述计数子句，对每个分组内的目标项进行计数，以获得所述目标项的出现次数。4.根据权利要求3所述的方法，其中，所述第一查询语句还包括：开窗子句、第一拼接子句、排序子句、转换子句、第二拼接子句、匹配子句和数组子句；所述采用所述第一查询语句，基于所述出现次数对所述目标项进行排序处理，以获得所述目标项的排序结果，包括：采用所述开窗子句，基于所述出现次数为所述目标项分配序号，并基于所述目标项的所述序号和所述出现次数构建项头表，其中，所述项头表的每行元素包括每个目标项的序号和出现次数；采用所述第一拼接子句，针对所述项头表的每行元素，将所述序号和所述出行次数采用分隔符进行拼接；采用所述排序子句和所述转换子句，基于所述每行元素包含的序号，对所述每行元素进行排序；采用所述第二拼接子句和所述匹配子句，对排序后的每行元素进行拼接，并在拼接后的每行元素中去除所述序号和所述分隔符，以获得排序后的目标项组成的字符串；采用所述数组子句，将所述字符串转换为数组，将所述数组作为所述目标项的排序结果。5.根据权利要求1
‑
4任一项所述的方法，其中，所述第二查询语句包括：选择子句；所述采用第二查询语句，调用预设函数，包括：采用所述选择子句，调用所述预设函数。6.根据权利要求1
‑
4任一项所述的方法，其中，所述预设函数部署在多个计算节点上；所述采用所述预设函数根据所述目标项的排序结果对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果，包括：采用所述多个计算节点上的所述预设函数，根据所述目标项的排序结果，并行对所述
原始数据集进行数据挖掘处理，以获得数据挖掘结果。7.根据权利要求6所述的方法，其中，所述多个计算节点包括：合并节点和多个添加节点；所述预设函数包括：添加函数、合并函数和转换函数，所述添加函数部署在每个添加节点上，所述合并函数和所述转换函数部署在所述合并节点上；所述采用所述多个计算节点上的所述预设函数，根据所述目标项的排序结果，并行对所述原始数据集进行数据挖掘处理，以获得数据挖掘结果，包括：根据所述目标项的排序结果和所述原始数据集，获得多个本地数据集，并将所述多个本地数据集分别分配给所述多个添加节点；并行采用每个添加节点上部署的所述添加函数，基于所述本地数据集，构建所述每个添加节点对应的本地频繁模式树；采用所述合并节点上部署的所述合并函数，对所述每个添加节点对应的本地频繁模式树进行合并处理，以获得最终的频繁模式树；采用所述合并节点上部署的所述转换函数，基于所述最终的频繁模式树获得所述数据挖掘结果。8.一种数据挖掘装置，包括：排序模块，用于采用第一查询语句，获取原始数据集中目标项的排序结果；挖掘模块，用于采用第二查询语句，调用预设函数...

【专利技术属性】
技术研发人员：鲁嘉俊，叶玮彬，刘涛，
申请(专利权)人：百度中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人