基于有序模糊C均值聚类的青霉素发酵过程阶段划分方法技术

技术编号:13014728 阅读:67 留言:0更新日期:2016-03-16 13:19
基于有序模糊C均值聚类的青霉素发酵过程阶段划分方法,包括以下步骤:(1)输入有序数据集;(2)选定聚类数目,对有序数据集进行初始分割,获得各数据段的初始聚类中心和伪边界以及样本点的初始隶属矩阵;(3)构造目标函数,在满足严格序列性约束的前提下,逐点对各数据段中前半段和后半段内样本点进行重新划分,并计算样本点重新划分后的隶属度;(4)迭代进行步骤(3)直至没有任何样本点的重新划分被接收;(5)输出最终的隶属度矩阵以及各数据段的聚类中心,完成序列数据分割。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,是一种用于序列数据分割的有序模糊C均值聚类方 法。
技术介绍
随着大数据时代的来临,各行各业所产生的海量数据已成为一种宝贵的资源。深 入挖掘海量数据中所隐藏的知识和信息,已经成为诸多领域共同的需求,这也促使了数据 挖掘技术的产生。序列数据,或称轨迹数据,是一种特殊的数据存在形式。在序列数据中, 各样本点按照一定的时空关系(轨迹)顺序生成,前面的样本点会影响到后面的样本点,因 而各样本点之间并不相互独立。日常生产生活中的很多设备都会产生序列数据,如运动传 感器、GPS、摄像机、电子笔、各类工业传感器等。为了挖掘序列数据中蕴含的数据模式,从而 对其数据特征进行深入细致的分析,首先需要对序列数据进行分割或聚类,即依照某种规 则将各样本点划分到不同的数据段或数据类,每个数据段内的样本点具有相似的特性,不 同数据段之间的数据特征各不相同。 由于序列数据具有特定的序列性,其分割结果需满足以下两个条件才有物理意 义:(1)分割后各样本点仍保持原来的顺序;(2) -个样本点只能归属于一个数据段或两个 相邻的数据段。虽然传统的K均值聚类、模糊C均值聚类等方法可本文档来自技高网...

【技术保护点】
一种用于序列数据分割的有序模糊C均值聚类方法,其特征在于:包括以下步骤:(1)输入有序数据集;(2)选定聚类数目,对有序数据集进行初始分割,获得各数据段的初始聚类中心和伪边界以及样本点的初始隶属度矩阵;(3)构造目标函数,在满足严格序列性约束的前提下,逐点对各数据段中前半段和后半段内样本点进行重新划分,并计算样本点重新划分后的隶属度,如果由该样本点隶属度变化所引起的目标函数变化为负,接收这一重新划分,并更新该样本点的隶属度以及各数据段的聚类中心,继续重新划分当前数据段的下一个样本点,否则拒绝这一重新划分,跳转到下一数据段逐点进行重新划分;(4)迭代进行步骤(3)直至没有任何样本点的重新划分被接...

【技术特征摘要】

【专利技术属性】
技术研发人员:罗利佳包士毅毛剑峰唐迪
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1