面向智慧校园数据分析的选择性深度聚类集成方法及装置制造方法及图纸

技术编号:39193657 阅读:10 留言:0更新日期:2023-10-27 08:40
本申请涉及一种面向智慧校园数据分析的选择性深度聚类集成方法及装置。所述方法包括,采用基于选择性的聚类集成策略和深度聚类技术,通过同时考虑集成质量和多样性两个方面筛选出高质量且多样性丰富的基聚类作为聚类集成的候选,最终将这些候选基聚类结果进行聚类集成,从而大大提升智慧校园数据的整体深度聚类性能和稳定性。聚类性能和稳定性。聚类性能和稳定性。

【技术实现步骤摘要】
面向智慧校园数据分析的选择性深度聚类集成方法及装置


[0001]本专利技术涉及数据挖掘和人工智能领域,特别是涉及一种面向智慧校园数据分析的选择性深度聚类集成方法及装置。

技术介绍

[0002]随着物联网和人工智能技术的不断发展,智慧校园建设已经成为当前教育领域的主流趋势。如今的智慧校园采集到的数据量巨大,数据的结构复杂,标记数据严重不足,并且数据之间的相关性更加复杂,数据的格式和类型也是多种多样的,因此,如何从这些复杂的智慧校园数据中高效地挖掘出有意义且简洁的信息是一个亟待解决的问题。
[0003]深度聚类方法通过将具有强大表示学习能力的无监督深度学习网络与聚类相结合,能应用于多种复杂数据提取潜在有利于聚类的低维特征表示完成聚类,为挖掘这些复杂智慧校园数据提供了一种有力手段。
[0004]然而,上述传统的深度聚类方法在智慧校园环境中具有聚类结果波动大的技术问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种面向智慧校园数据分析的选择性深度聚类集成方法和一种面向智慧校园数据分析的选择性深度聚类集成装置。
[0006]为了实现上述目的,本专利技术实施例采用以下技术方案:
[0007]一方面,提供一种面向智慧校园数据分析的选择性深度聚类集成方法,包括:
[0008]采集智慧校园场景中目标数据样本和类别信息;目标数据样本包括学生信息数据样本、教师信息数据样本或安防数据样本;
[0009]根据类别信息对目标数据样本进行预处理,获得预处理样本;
[0010]使用自编码无监督网络深度聚类方法对预处理样本进行特定次深度聚类,获得特定个基聚类,将各基聚类组成初始候选集成;
[0011]采用选择性策略,对初始候选集成的各基聚类进行质量或多样性的评估筛选,获得新候选集成;
[0012]计算新候选集成中各候选基聚类簇的不确定性,根据各候选基聚类簇的不确定性构建各集成驱动簇指标;各集成驱动簇指标用于评价各候选基聚类簇的可靠性;
[0013]根据各集成驱动簇指标构建加权图;
[0014]使用Tcut算法对加权图进行划分,获得各最终聚类簇。
[0015]另一方面,还提供一种面向智慧校园数据分析的选择性深度聚类集成装置,包括:采集模块、预处理模块、深度聚类模块、选择模块、指标构建模块、加权图构建模块和划分模块。
[0016]采集模块,用于采集智慧校园场景中目标数据样本和类别信息;目标数据样本包括学生信息数据样本、教师信息数据样本或安防数据样本;
[0017]预处理模块,用于根据类别信息对目标数据样本进行预处理,获得预处理样本;
[0018]深度聚类模块,用于使用自编码无监督网络深度聚类方法对预处理样本进行特定次深度聚类,获得特定个基聚类,将各基聚类组成初始候选集成;
[0019]选择模块,用于采用选择性策略,对初始候选集成的各基聚类进行质量或多样性的评估筛选,获得新候选集成;
[0020]指标构建模块,用于计算新候选集成中各候选基聚类簇的不确定性,根据各候选基聚类簇的不确定性构建各集成驱动簇指标;各集成驱动簇指标用于评价各候选基聚类簇的可靠性;
[0021]加权图构建模块,用于根据各集成驱动簇指标构建加权图;
[0022]划分模块,用于使用Tcut算法对加权图进行划分,获得各最终聚类簇。
[0023]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0024]上述面向智慧校园数据分析的选择性深度聚类集成方法及装置,采用基于选择性的聚类集成策略和深度聚类技术,通过同时考虑集成质量和多样性两个方面筛选出高质量且多样性丰富的基聚类作为聚类集成的候选,最终将这些候选基聚类结果进行聚类集成,从而大大提升智慧校园数据的整体深度聚类性能和稳定性。
附图说明
[0025]为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]图1为一个实施例中面向智慧校园数据分析的选择性深度聚类集成方法的流程示意图;
[0027]图2为一个实施例中深度聚类方法步骤的流程示意图;
[0028]图3为一个实施例中选择性策略步骤的流程示意图;
[0029]图4为一个实施例中面向智慧校园数据分析的选择性深度聚类集成装置的模块结构示意图。
具体实施方式
[0030]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0031]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
[0032]需要说明的是,在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。
[0033]在研究实现本申请的过程中,专利技术人发现现有的深度聚类方法在面对复杂智慧校
园数据时,容易受到超参和无监督深度学习网络初始化影响,导致聚类结果波动大,算法鲁棒性差等问题。
[0034]对此,本专利技术提供了一种面向智慧校园数据分析的选择性深度聚类集成方法及装置,采用基于选择性的聚类集成策略和深度聚类技术,通过同时考虑集成质量和多样性两个方面筛选出高质量且多样性丰富的基聚类作为聚类集成的候选,最终将这些候选基聚类结果进行聚类集成,从而大大提升智慧校园数据的整体深度聚类性能和稳定性。
[0035]下面将结合本专利技术实施例图中的附图,对本专利技术实施方式进行详细说明。
[0036]在一个实施例中,如图1所示,本申请实施例提供了一种面向智慧校园数据分析的选择性深度聚类集成方法,包括如下处理步骤S11

S17:
[0037]S11,采集智慧校园场景中目标数据样本和类别信息;目标数据样本包括学生信息数据样本、教师信息数据样本或安防数据样本。
[0038]可以理解,智慧校园场景主要包括学生信息场景、教师信息场景和安防数据场景等场景。其中,学生信息场景中的目标数据样本可以包括但不限于学生学籍数据样本、学生成绩数据样本和学生活动数据样本;教师信息场景中的目标数据样本可以包括但不限于教师个人信息数据样本和科研数据样本;安防数据样本可以包括但不限于门禁数据样本和视频数据样本。其中,信息类别是指目标数据样本中的数据信息类别,例如,在教师个人信息数据样本中,信息类别可以包括但不限于姓名、学历、年龄、性别、所授课程名称、主本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向智慧校园数据分析的选择性深度聚类集成方法,其特征在于,包括:采集智慧校园场景中目标数据样本和类别信息;所述目标数据样本包括学生信息数据样本、教师信息数据样本或安防数据样本;根据所述类别信息对所述目标数据样本进行预处理,获得预处理样本;使用自编码无监督网络深度聚类方法对所述预处理样本进行特定次深度聚类,获得特定个基聚类,将各所述基聚类组成初始候选集成;采用选择性策略,对所述初始候选集成的各基聚类进行质量或多样性的评估筛选,获得新候选集成;计算所述新候选集成中各候选基聚类簇的不确定性,根据各所述候选基聚类簇的不确定性构建各集成驱动簇指标;各所述集成驱动簇指标用于评价各所述候选基聚类簇的可靠性;根据各所述集成驱动簇指标构建加权图;使用Tcut算法对所述加权图进行划分,获得各最终聚类簇。2.根据权利要求1所述的面向智慧校园数据分析的选择性深度聚类集成方法,其特征在于,使用自编码无监督网络深度聚类方法对所述预处理样本进行特定次深度聚类,获得特定个基聚类,将各所述基聚类组成初始候选集成的步骤,包括:在当前深度聚类轮次中,重置深度聚类网络的初始参数;在当前更新轮次中,计算所述深度聚类网络的自编码器的重构损失,根据所述重构损失更新自编码器的参数;通过学生t分布将所述深度聚类网络的聚类层各嵌入点映射到软簇分配;各所述嵌入点由所述自编码器通过映射所述预处理样本的特征得到;根据所述软簇分配计算聚类损失,根据所述聚类损失计算梯度并通过反向传播,将所述梯度传递至所述深度聚类网络;所述聚类损失为所述软簇分配与预定的辅助目标分布之间的相对熵;根据所述梯度更新所述深度聚类网络的参数;根据更新后的所述深度聚类网络的参数再次计算所述自编码器的重构损失,进入下一更新轮次;当所述深度聚类网络连续两轮的参数更新幅度小于设定阈值时,保存更新后的所述深度聚类网络的最终参数,根据所述深度聚类网络的最终参数获得一个所述基聚类;再次重置所述深度聚类网络的初始参数,进入下一深度聚类轮次;当深度聚类轮次达到特定值时,保存获得的各所述基聚类,将各所述基聚类组成初始候选集成。3.根据权利要求2所述的面向智慧校园数据分析的选择性深度聚类集成方法,其特征在于,所述辅助目标分布通过将所述软簇分配进行平方归一化得到。4.根据权利要求1至3任一项所述的面向智慧校园数据分析的选择性深度聚类集成方法,其特征在于,采用选择性策略,对所述初始候选集成的各基聚类进行质量或多样性的筛选,获得新候选集成的步骤,包括:对各所述基聚类进行质量评估,获得各所述基聚类的集成标准化互信息;选择最大的所述集成标准化互信息对应的所述基聚类构成所述新候选集成;
在当前选取轮次中,将剩余的各基聚类分别与所述新候选集成形成各临时集成;剩余的各所述基聚类为所述初始候选集成中除所述新候选集成之外的各所述基聚类;分别计算各所述临时集成的平衡标准化互信息,选择最大的所述平衡标准化互信息对应的所述临时集成作为更新后的所述新候选集成;所述平衡标准化互信息根据所述集成标准化互信息和成对标准化互信息构建得到;再次将剩余的各所述基聚类分别与更新后的所述新候选集成形成下一批各所述临时集成,进入下一选取轮次的选取;当选取轮次达到设定的轮次阈值后,保存最后更新的所述新候选集成。5.一种面向智慧校园数据分析的选择性深度聚类集成装置,其特征在于,包括:采集模块、预处理模块、深度聚类模块、选择模块、指标构建模块、加权图构建模块和划分模...

【专利技术属性】
技术研发人员:钱悦吴添君程勇黄友姚世新张亮周勇沈高方雪垠曾令斌方宏汪浩杨扬易恒柱张蕾曹远
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1