【技术实现步骤摘要】
本专利技术属于信息检索,尤其涉及一种基于大数据的数据挖掘方法及系统。
技术介绍
1、目前,随着信息技术的不断发展,教育领域的数据量呈现指数级增长,尤其是在线教育和智能教育系统中,学生的学习行为、课程反馈、教学内容等数据日益增多。然而,现有的传统数据分析方法,如基于规则的统计分析方法,往往只能处理相对简单和少量的数据,并且对于多源异构数据的处理和分析存在较大的局限性。例如,在处理学生的在线学习行为数据、课程反馈数据和教师发布的教学内容时,现有技术难以高效地融合这些异构数据源,并且无法充分挖掘出潜在的学生学习模式和课程优化机会,尤其是当数据量极其庞大时,现有的系统往往无法高效地完成数据的清洗、特征提取、降维和模型训练等一系列任务。因此,亟需一种能够在面对大规模、多源异构数据的情况下,依然能够实现高效、精准的数据挖掘方法和系统,以提升教育数据分析的精度和效率。
技术实现思路
1、针对上述存在的技术不足,本专利技术的目的是提出一种基于大数据的数据挖掘方法,旨在解决现有技术中常见的数据分析方法,尤其
...【技术保护点】
1.一种基于大数据的数据挖掘方法,其特征在于,方法包括:
2.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤S20中,标准化数据集D2包括:
3.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤S30中,协方差矩阵C的构建公式为:
4.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤S30中,特征向量的贡献率计算公式为:
5.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤S40中,K-means聚类算法采用公式:
6.如权利要求1所述的一种基
...【技术特征摘要】
1.一种基于大数据的数据挖掘方法,其特征在于,方法包括:
2.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤s20中,标准化数据集d2包括:
3.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤s30中,协方差矩阵c的构建公式为:
4.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤s30中,特征向量的贡献率计算公式为:
5.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤s40中,k-means聚类算法采用公式:
6.如权利要求1所述的一种基于大数据的数据挖掘方法,其特征在于,步骤s20中,正负面情感倾向分值是根据经过训练的情感词典统计并加权得到。
【专利技术属性】
技术研发人员:皇甫大双,朱自轩,王玉婷,孙红艳,
申请(专利权)人:江苏安全技术职业学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。