当前位置: 首页 > 专利查询>纪震专利>正文

一种基因表达数据的聚类分析方法及终端设备技术

技术编号：22058782 阅读：26 留言：0更新日期：2019-09-07 16:38

本发明专利技术公开一种基因表达数据的聚类分析方法及终端设备，所述方法包括步骤：确定基因表达数据的编码方案，获取基因表达数据和构成基因聚类中心矩阵以及聚类隶属度矩阵；初始化智能单粒子的位置和速度矢量，并且进行分段，生成相应子矢量，设置迭代计算过程中的相关参数；根据学习智能策略，不断迭代计算，更新智能单粒子的位置矢量；由智能单粒子的最终位置子矢量重构出聚类中心矩阵，得到最优的基因聚类中心。本发明专利技术提供的聚类分析方法与传统方法相比在计算复杂度上至少降低一个数量级，大幅度地降低了计算时间，对于数据规模呈现爆炸性增加的髙通量基因数据处理具有重要意义。

A Clustering Analysis Method and Terminal Equipment for Gene Expression Data

全部详细技术资料下载

【技术实现步骤摘要】
一种基因表达数据的聚类分析方法及终端设备
本专利技术涉及基因数据分析领域，尤其涉及一种基因表达数据的聚类分析方法及终端设备。
技术介绍
现有技术研究数以万计的基因在不同生理状态下的表达状况时，必须借助基因芯片技术，可以在一次芯片实验中同时测量成千上万个基因的表达，这是基因表达数据分析的最大优点-高通量性。一次基因芯片实验所获得的基因表达数据包括成千上万个基因在各种实验条件下(如不同的组织、不同的生长阶段、不同的健康状况等)所得到的数据构成的矩阵，由于基因数量大和生物信息复杂，聚类分析自然成为处理基因表达数据的重要手段。通过聚类，将具有相同表达模式的基因归为一类，挖掘相似的生物功能、相似的细胞起源或相似的调节作用，对深入了解基金功能和临床医学诊断治疗具有重要的现实意义。传统聚类算法已用于基因表达数据分析，如层次聚类(hierachicalclustering)、K-均值聚类(K-meansclustering)、主成分分析(principalcomponentanalysis)和自组织映射(self-organizingmaps,SOMs)等，但面对高通量的基因表达数据，这些算法均表现出计算时间太长和聚类结果不稳的缺点。新的聚类方法普遍开始引入计算智能算法，特别是基于群体智能的粒子群(ParticleSwarmOptimization,PSO和遗传算法(GeneticAlgorithm,GA)，对一些具有代表性的基因表达数据拥有良好的聚类效果，但同时要面对优化搜索速度和精度之间的矛盾，特别是针对集成度越高的基因芯片所产生的更大海量数据，在没有超级计算能力的支...

【技术保护点】
1.一种基因表达数据的聚类分析方法，其特征在于，包括步骤：确定基因表达数据的编码方案，获取基因表达数据和构成基因聚类中心矩阵以及聚类隶属度矩阵；初始化智能单粒子的位置和速度矢量，并且进行分段，生成相应子矢量，设置迭代计算过程中的相关参数；根据学习智能策略，不断迭代计算，更新智能单粒子的位置矢量；由智能单粒子的最终位置子矢量重构出聚类中心矩阵，得到最优的基因聚类中心。

【技术特征摘要】
1.一种基因表达数据的聚类分析方法，其特征在于，包括步骤：确定基因表达数据的编码方案，获取基因表达数据和构成基因聚类中心矩阵以及聚类隶属度矩阵；初始化智能单粒子的位置和速度矢量，并且进行分段，生成相应子矢量，设置迭代计算过程中的相关参数；根据学习智能策略，不断迭代计算，更新智能单粒子的位置矢量；由智能单粒子的最终位置子矢量重构出聚类中心矩阵，得到最优的基因聚类中心。2.根据权利要求1所述基因表达数据的聚类分析方法，其特征在于，所述获取基因表达数据和构成基因聚类中心矩阵以及聚类隶属度矩阵的步骤包括：令Ⅹ为所获取的M个L维基因表达矩阵，x1∈RL，RL是L维的欧几里得空间，其中，令Y是Ⅹ的一个聚类中心，构成基因聚类中心矩阵其中，令x和y的距离值d(x,y)最小，则认为xi属于第j类，记作фij＝1，其中ф称为聚类隶属度矩阵，标记着基因表达数据的聚类结果，大小为M×N。3.根据权利要求1所述基因表达数据的聚类分析方法，其特征在于，所述初始化智能单粒子的位置和速度矢量，并且进行分段，生成相应子矢量，设置迭代计算过程中的相关参数的步骤包括：初始化智能单粒子的位置矢量Z和飞行速度矢量V，维数均是1×D，其中D＝N×L，Z和V的每一维数据均随机产生，取值范围为对位置矢量Z分段，把D维空间分成S部分，即把整个位置矢量分成S个位置子矢量与其对应的速度子矢量为初始化迭代计数器k，即令k＝0。4.根据权利要求3所述基因表达数据的聚类分析方法，其特征在于，根据基因表达数据的不同特征态调整分段数S。5.根据权利要求1所述基因表达数据的聚类分析方法，其特征在于，所述根据学习智能策略，不断迭代计算，更新智能单粒子的位置矢量的步骤包括：迭代到第k次时,基因聚类中...

【专利技术属性】
技术研发人员：纪震，
申请(专利权)人：纪震，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人