【技术实现步骤摘要】
一种基于动态网络熵的生物标记物识别方法与系统
[0001]本专利技术属于生物信息计算中的疾病生物标记物识别领域,尤其涉及一种基于动态网络熵的生物标记物识别方法与系统。
技术介绍
[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]在医疗领域,不断提高疾病预测、防控、诊断、治疗等医疗过程的确定性、预见性和可控性,对于当前人类健康及发展具有重要意义,因此,系统地识别获取疾病发生及阶段性发展的动态机制显得尤为重要。
[0004]例如,糖尿病这一常见慢性代谢疾病,患病知晓率很低,很多无症状患者被确诊。作为一种复杂疾病,糖尿病的发病机制至今仍未被完全揭示,并且由于糖尿病患者的症状往往不明显,现有的对糖尿病的传统诊断方式,比如血糖检测等方法,成本较高,同时难以提前预测健康状态向疾病状态的转变并迅速进行干预,很难做到疾病的早发现早治疗。
[0005]生物标记物在疾病检测和健康监测方面有很高的应用价值,致力于疾病生物标记物发现、验证的研究每年都在增加。较传统方法,生物标记 ...
【技术保护点】
【技术特征摘要】
1.一种基于动态网络熵的生物标记物识别方法,其特征在于,包括以下步骤:获取疾病相关的功能基因通路和基因间相互作用,生成基因网络通路;对所述基因网络通路中的基因,获取对应所述疾病不同阶段的基因表达数据;基于动态网络熵,对于疾病不同阶段,计算基因网络通路中每个通路的通路熵;通过对疾病不同阶段每个通路的通路熵进行统计分析,确定对所述疾病具有标识作用的通路。2.如权利要求1所述的基于动态网络熵的生物标记物识别方法,其特征在于,疾病的阶段包括正常阶段和疾病阶段,若所述疾病包括病理阶段,则所述疾病阶段还按照病理阶段划分。3.如权利要求1所述的基于动态网络熵的生物标记物识别方法,其特征在于,通路的通路熵计算方法包括:计算所述通路中每个基因的熵和边的熵;根据所述通路中基因的熵和边的熵,计算所述通路的通路熵。4.如权利要求3所述的基于动态网络熵的生物标记物识别方法,其特征在于,单个基因X的熵计算方法为:假设通路P中有n条边,将其中任一条边e
k
连接的两个基因记为X和Y,则这条边的熵概率计算方法为:其中,通路P的通路熵计算方法为:其中,p(X
i
)代表基因X表达为X
i
的概率,p(X
j
)代表基因Y表达为Y
j
的概率,p(X
i
,Y
j
)表示X
i
和Y
j
的联合概率分布函数,表示基因记为X和Y之间的互信息。5.如权利要求1所述的基于动态网络熵的生物标记物识别方法,其特征在于,确定对所述疾病具有标识作用的通路包括:若所述疾病的阶段包括正常阶段和一个疾病阶段,对于每个通路,均获取多个设定时间节点的正常阶段和疾病阶段的基因表达数据;基于动态网络熵计算得到每条通路的多个正常阶段通路熵和多个疾病阶段通路熵,记为正常组和疾病组;对每条通路的疾病组和正常组进行统计分析,将差异性大于设定阈值的通路作为对所述疾病具有标识作用的通路;若所述疾病的阶段包括正常阶段和多个疾病阶段,对于每个通路,获取所有阶段的基因表达数据;基于动态网络熵计算得到每条通路的所...
【专利技术属性】
技术研发人员:刘治平,沈忱,曹怡,王怡娟,高瑞,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。