聚类方法和装置制造方法及图纸

技术编号:16529417 阅读:34 留言:0更新日期:2017-11-09 21:18
本发明专利技术公开了一种聚类方法和装置。其中,该方法包括:获取神经网络模型;将目标数据输入神经网络模型,确定目标数据对神经网络模型中至少一个中间层节点的激活程度;根据每个中间层节点的激活程度在至少一个中间层节点中选择目标数据的聚类节点;根据聚类节点确定目标数据的聚类结果。本发明专利技术解决了相关技术中结合神经网络模型的聚类方法使用复杂度较高的技术问题。

【技术实现步骤摘要】
聚类方法和装置
本专利技术涉及聚类领域,具体而言,涉及一种聚类方法和装置。
技术介绍
现有的数据聚类方法,例如K均值聚类(K-means)方法和自组织映射(SelfOrganizingMaps)聚类方法,需要用户给定数据样本之间的相似度或者相似度计算方法。上述的聚类方法需要用户懂得如何选择或设计相似度或相似度计算方法,增加了数据聚类方法的使用难度,进一步地,当用户选定或设计的相似度或者相似度计算方法不恰当时,聚类方法所能实现的聚类效果可能不能满足用户的需求。例如,在对图像数据进行聚类分析时,如果使用欧式距离计算图像之间的相似度,则不能反映图像内容的平移、尺度等变化,从而导致聚类分析失败。再如,在对脉搏波时序数据进行聚类分析时,如果使用动态时间规整(DTW)法计算脉搏波时序数据片段之间的相似度,则可能丢失脉搏波信号中的重搏波相对位置平移信息,导致聚类结果与用户预期效果不一致。在现有技术中,已经具有采用神经网络技术与聚类结合的技术对数据进行聚类的方法,例如,申请号为201310530626.9、专利名称为一种基于深度学习的聚类方法的专利,提供了一种结合神经网络模型的聚类方法,具体的技术方案为在神经网络模型中指定特定的中间层节点作为用于聚类的特征层,并且,还需要对神经网络模型的目标函数进行修改,加入聚类的类内约束函数,这种方式需要预先确定用于聚类的中间层节点是哪些节点,增加了使用该方法的人工部分的复杂度,并且修改了神经网络模型的目标函数,从而改变了神经网络原来的行为和表现。现有技术中还有一些其他的改进的聚类方法,例如,需要在神经网络模型的节点中增加离散的节点,根据离散节点的状态进行聚类等等。在上述的现有技术中的技术方案由于对神经网络模型具有一定的限制条件,因此限定了聚类方法的使用范围。针对相关技术中结合神经网络模型的聚类方法使用复杂度较高的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种聚类方法和装置,以至少解决相关技术中结合神经网络模型的聚类方法使用复杂度较高的技术问题。根据本专利技术实施例的一个方面,提供了一种聚类方法,该方法包括:获取神经网络模型;将目标数据输入神经网络模型,确定目标数据对神经网络模型中至少一个中间层节点的激活程度;根据每个中间层节点的激活程度在至少一个中间层节点中选择目标数据的聚类节点;根据聚类节点确定目标数据的聚类结果。进一步地,根据每个中间层节点的激活程度在至少一个中间层节点中选择目标数据的聚类节点包括:获取输入的聚类节点的数量K;根据每个中间层节点的激活程度在至少一个中间层节点中选择K个节点作为聚类节点。进一步地,根据每个中间层节点的激活程度在至少一个中间层节点中选择K个节点作为聚类节点包括:将神经网络模型在接收输入的目标数据之后每个中间层节点对应的激励函数的输出值作为激活程度;根据至少一个中间层节点的激活程度分别计算每个中间层节点的排序参数值;按照每个中间层节点的排序参数值对至少一个中间层节点进行排序,选取前K个节点作为聚类节点。进一步地,根据聚类节点确定目标数据的聚类结果包括:根据选择出的K个聚类节点的组合将目标数据划分到组合对应的类别。进一步地,获取神经网络模型包括:接收输入的神经网络模型的结构参数以确定神经网络模型的结构;通过训练样本集对结构确定的神经网络模型进行训练,其中,训练样本集中的每个样本包括样本数据和样本类别标签,神经网络模型的训练目标为在输入样本数据之后的输出与样本数据对应的样本类别标签的差距最小。进一步地,在对多个目标数据进行聚类并得到聚类结果之后,该方法还包括:通过可视化方式显示多个目标数据的聚类分布图。根据本专利技术实施例的另一方面,还提供了一种聚类装置,该装置包括:获取单元,用于获取神经网络模型;输入单元,用于将目标数据输入神经网络模型,确定目标数据对神经网络模型中至少一个中间层节点的激活程度;选择单元,用于根据每个中间层节点的激活程度在至少一个中间层节点中选择目标数据的聚类节点;确定单元,用于根据聚类节点确定目标数据的聚类结果。进一步地,选择单元包括:获取模块,用于获取输入的聚类节点的数量K;选择模块,用于根据每个中间层节点的激活程度在至少一个中间层节点中选择K个节点作为聚类节点。进一步地,选择模块包括:逻辑模块,用于将神经网络模型在接收输入的目标数据之后每个中间层节点对应的激励函数的输出值作为激活程度;计算模块,用于根据至少一个中间层节点的激活程度分别计算每个中间层节点的排序参数值;选择子模块,用于按照每个中间层节点的排序参数值对至少一个中间层节点进行排序,选取前K个节点作为聚类节点。进一步地,该装置还包括:显示单元,用于在对多个目标数据进行聚类并得到聚类结果之后,通过可视化方式显示多个目标数据的聚类分布图。进一步地,获取单元包括:接收模块,用于接收输入的神经网络模型的结构参数以确定神经网络模型的结构;训练模块,用于通过训练样本集对结构确定的神经网络模型进行训练,其中,训练样本集中的每个样本包括样本数据和样本类别标签,神经网络模型的训练目标为在输入样本数据之后的输出与样本数据对应的样本类别标签的差距最小。进一步地,确定单元包括:显示模块,用于通过可视化方式显示目标数据的聚类结果。根据本专利技术实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行本专利技术的聚类方法。根据本专利技术实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行本专利技术的聚类方法。在本专利技术实施例中,通过获取神经网络模型;将目标数据输入神经网络模型,确定目标数据对神经网络模型中至少一个中间层节点的激活程度;根据每个中间层节点的激活程度在至少一个中间层节点中选择目标数据的聚类节点;根据聚类节点确定目标数据的聚类结果,解决了相关技术中结合神经网络模型的聚类方法使用复杂度较高的技术问题,进而实现了无需人工选取相似度、无需在中间层中指定聚类的节点、自动根据中间层节点的激活程度在中间层节点中选取聚类节点的效果,并且适用于所有种类的神经网络模型,无需限制神经网络模型中节点类型是连续或离散,神经网络模型中的所有节点可以都是连续节点,具有更强的适用性的技术效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的聚类方法的流程图;图2是根据本专利技术实施例的另一种可选的聚类方法的流程图;图3是根据本专利技术实施例的一种可选的神经网络模型的示意图;图4是根据本专利技术实施例的一种可选的聚类装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当本文档来自技高网
...
聚类方法和装置

【技术保护点】
一种聚类方法,其特征在于,包括:获取神经网络模型;将目标数据输入所述神经网络模型,确定所述目标数据对所述神经网络模型中至少一个中间层节点的激活程度;根据每个中间层节点的激活程度在所述至少一个中间层节点中选择所述目标数据的聚类节点;根据所述聚类节点确定所述目标数据的聚类结果。

【技术特征摘要】
1.一种聚类方法,其特征在于,包括:获取神经网络模型;将目标数据输入所述神经网络模型,确定所述目标数据对所述神经网络模型中至少一个中间层节点的激活程度;根据每个中间层节点的激活程度在所述至少一个中间层节点中选择所述目标数据的聚类节点;根据所述聚类节点确定所述目标数据的聚类结果。2.根据权利要求1所述的方法,其特征在于,根据每个中间层节点的激活程度在所述至少一个中间层节点中选择所述目标数据的聚类节点包括:获取输入的所述聚类节点的数量K;根据所述每个中间层节点的激活程度在所述至少一个中间层节点中选择K个节点作为所述聚类节点。3.根据权利要求2所述的方法,其特征在于,根据所述每个中间层节点的激活程度在所述至少一个中间层节点中选择K个节点作为所述聚类节点包括:将所述神经网络模型在接收输入的所述目标数据之后每个中间层节点对应的激励函数的输出值作为所述激活程度;根据所述至少一个中间层节点的激活程度分别计算每个中间层节点的排序参数值;按照每个中间层节点的排序参数值对所述至少一个中间层节点进行排序,选取前K个节点作为所述聚类节点。4.根据权利要求2所述的方法,其特征在于,根据所述聚类节点确定所述目标数据的聚类结果包括:根据选择出的K个聚类节点的组合将所述目标数据划分到所述组合对应的类别。5.根据权利要求1所述的方法,其特征在于,获取神经网络模型包括:接收输入的所述神经网络模型的结构参数以确定所述神经网络模型的结构;通过训练样本集对结构确定的神经网络模型进行训练,其中,所述训练样本集中的每个样本包括样本数据和样本类别标签,所述神经网络模型的训练目标为在输入所述样本数据之后的输出与所述样本数据对应的样本类别标签的差距最小。6.根据权利要求1所述的方法,其特征在于,在对多个目标数据进行聚类并得到聚类结果之后,所述方法还包括:通过可视化方式显示所述多个目标数据的聚类分布图。7.一种聚类装置,其特征在于,包括:获取单元,用于获取神经网络模型;输入单元,用于将目标数据输入所述神经网络模型,确定所述目标数据对所述神...

【专利技术属性】
技术研发人员:王虎
申请(专利权)人:悦享趋势科技北京有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1