【技术实现步骤摘要】
一种使用三支概念判断物种间系统发育的方法
本专利技术涉及一种物种系统发育的分析方法,具体地说是一种使用三支概念判断物种间系统发育的方法。
技术介绍
系统发育分析是研究物种进化和物种系统分类的一种方法。研究对象为携带遗传信息的生物序列,目前常采用特定的数理统计算法来计算物种间的系统发生关系,并用系统进化树来概括物种间的这种亲缘关系。2014年,祁建军等人在Switzerland:SpringerInternationalPublishing出版的论文集《RoughSetsandKnowledgeTechnology》发表“Three-wayformalconceptlattice”一文中提出一种新形式概念——三支概念,具体地分为:对象导出的三支概念(X,(N,B))和属性导出的三支概念((X,Y),N)。由于属性导出的三支概念和对象导出的三支概念是对偶的,故本专利技术只侧重于一个方面——对象导出的三支概念。为方便起见,本专利技术将对象导出的三支概念简称为“三支概念”。每一对象导出的三支概念(X,(N,B))可以理解为:物种个体集(亦称对象集)X将生物性状集(亦称属性 ...
【技术保护点】
1.一种使用三支概念判断物种间系统发育的方法,其特征是,包括以下步骤:(一)对原始生物信息系统(U,V,R)进行处理,以得到生物信息系统(U3,V3,R3),其处理方式是:1‑1、针对原始生物信息系统(U,V,R),对每一个物种xi∈U,先计算此物种的生物序列所含第j个碱基对的个数tij(i=1,2,…,m;j=1,2,…,16);再计算第j个碱基对占此物种的生物序列长度的百分比pij,其中m=|U|;当对m个物种全部计算完成后,得到矩阵Rm×16=(pij)m×16;1‑2、由矩阵Rm×16=(pij)m×16,依据
【技术特征摘要】
1.一种使用三支概念判断物种间系统发育的方法,其特征是,包括以下步骤:(一)对原始生物信息系统(U,V,R)进行处理,以得到生物信息系统(U3,V3,R3),其处理方式是:1-1、针对原始生物信息系统(U,V,R),对每一个物种xi∈U,先计算此物种的生物序列所含第j个碱基对的个数tij(i=1,2,…,m;j=1,2,…,16);再计算第j个碱基对占此物种的生物序列长度的百分比pij,其中m=|U|;当对m个物种全部计算完成后,得到矩阵Rm×16=(pij)m×16;1-2、由矩阵Rm×16=(pij)m×16,依据和计算第i个物种与第j个物种之间的亲缘关系相近程度rij,得到矩阵1-3、对矩阵按照模糊等价矩阵聚类方法进行计算,可得集合S={s1,s2,…,sv},进而通过计算F统计量值,在集合S中找到最优值s0,其中v为集合S中元素的个数;1-4、利用步骤1-3中的最优值s0,得到集合:其中,称为第j个部分物种集合,mj为第j个部分物种集合所含元素的个数;对于每一部分物种集合,将其共同不拥有的生物性状进行删除,得到集合Dj,据此得到约简后的生物性状集进而获得生物信息系统(U1,V1,R1);1-5、在生物信息系统(U1,V1,R1)中筛选出与研究目的有关的物种,组成物种集合U2,取V2=V1,R2定义为:xR2y,当且仅xR1y(对于任何x∈U2,y∈V2),可得到生物信息系统(U2,V2,R2);1-6、对于步骤1-5中得到的生物信息系统(U2,V2,R2),先将U2中的任意两个物种组合在一起,得到U3={z|z=(α,β),其中α,β∈U2,α≠β};再取V3=V2,R3定义为:任取z=(α,β)∈U3以及y∈V3,zR3y当且仅当αR2y且βR2y;由此得到生物信息系统(U3,V3,R3);(二)对处理后的生物信息系统(U3,V3,R3)进行三支概念的提取,其具体方式是:2-1、对步骤1-6中得到的生物信息系统(U3,V3,R3)进行净化处理,得到净化后的生物信息系统(U4,V4,R4);2-2、对净化后的生物信息系统(U4,V4,R4)进行三支概念的生成,得到生物信息系统的三支概念(Xp,(Q,D));(三)对得到的三支概念(Xp,(Q,D))进行分析计算,以利用三支概念格理论来判断物种的亲缘关系。2.根据权利要求1所述的判断物种间系统发育的方法,其特征是,步骤1-2中的矩阵Rm×16=(pij)m×16是依据下列公式计算得出的:其中,pik∈Rm×16。3.根据权利要求1所述的判断物种间系统发育的方法,其特征是,步骤1-3的在集合S中找最优值s0的计算方法是:1-3-1针对矩阵采用基于模糊等价矩阵的聚类方法,得到集合S={s1,s2,…,sv};当取si(i=1,2,…,v)时,即可得到集合:1-3-2在集合S={s1,s2,…,sv}中寻找集合S中的最优值s0,其具体算法是:输入:S={s1,s2,…,sv},Rm×16=(pij)m×16;输出:s0;1-3-2-1令Fa=φ,i=1;1-3-2-2确定每一并计算其中,1-3-2-3计算其中1-3-2-4计算其中1-3-2-5若则Fa=Fa∪{si},转1-3-2-6;否则,直接转1-3-2-6;1-3-2-6i=i+1,若i<v,转1-3-2-2;否则s0=minFa,输出s0,算法结束。4.根据权利要求1所述的判断物种间系统发育的方法,其特征是,步骤1-4中对生物信息系统的生物性状集合V进行约简,以得到生物信息系统(U1,V1,R1)的具体计算步骤是:1-4-1比较每一部分物种的生物形状:若任取有且则Dj=V-{y};若存在使得与至少有一个不成立,则Dj=Dj;1-4-2对所有的集合Dj求并集,得到集合取1-4-3输出生物信息系统(U1,V1,R1),其中U1=U,R1定义如下:任取x∈U1,y∈V1,xR1y当且仅当xRy。5.根据权利要求1所述的判断物种间系统发育的方法,其特征是,步骤2-1中的净化处理的具体步骤是:2-1-1对于生物信息系统(U3,V3,R3)中不拥有任何生物性状的物种个体,...
【专利技术属性】
技术研发人员:毛华,杨兰珍,王刚,武秀,郑珍,潘昭,
申请(专利权)人:河北大学,
类型:发明
国别省市:河北,13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。