【技术实现步骤摘要】
基于miRNA测序数据的帕金森疾病演化关键模块识别方法
[0001]本专利技术属生物信息
,具体涉及一种基于miRNA测序数据的帕金森疾病演化关键模块识别方法,通过研究miRNA表达数据的差异并构建共表达网络和模块网络对PD演化过程中的关键模块进行识别。
技术介绍
[0002]帕金森疾病(PD)是一种神经系统变性疾病,常见于中老年患者,并且帕金森疾病的早期症状不明显,一旦发现就往往就处于晚期,使得患者往往丧失了早发现早治疗的机会。外泌体及其miRNA不仅在PD等神经变性疾病中起到早期预警的作用,还有可能会根据miRNA对基因的调节作用起到靶向治疗的作用。目前对基于miRNA数据研究PD的方法和技术主要是针对疾病静态的过程即研究疾病的过程中部分疾病所处的阶段,并且主要是针对单独的miRNA分子进行研究。包括:(1)使用启发式算法。使用有监督学习或者无监督学习的方法识别网络中的疾病模块,但是启发式算法往往需要大量的样本数据,而生物领域样本往往是非常稀少的,这样导致启发式算法在这种情况下很难使用,效果也不是很好。(2)基于差 ...
【技术保护点】
【技术特征摘要】
1.一种基于miRNA测序数据的帕金森疾病演化关键模块识别方法,其特征在于步骤如下:步骤1,高通量测序数据预处理:利用fastp和fastxtoolkits软件对所有样本的高通量测序数据进行质量控制,将质量控制后的数据中的重复序列删除并对重复序列计数;然后,利用bowtie软件对去重后的序列与miRbase数据库中的miRNA碱基序列进行比对,统计匹配的miRNA序列数及去重时记录的重复序列数,得到miRNA表达的counts数据,再对miRNA表达的counts数据进行标准化处理,得到miRNA表达量数据;步骤2,差异表达分析:根据患病的不同阶段对样本进行分组,分为control组、stage1、stage2、stage3、stage4五组数据,其中,control组数据为正常样本,stage1~stage4四组数据为处于不同阶段的PD患者样本;然后,分别使用edgeR方法和T
‑
test方法对每两个阶段样本的miRNA表达量数据进行差异表达分析,得到差异表达miRNA,记为DE miRNA;对于使用edgeR方法进行差异表达分析得到的miRNA,如果满足p
‑
value<0.05且|logFC|>1,则认为该miRNA为DE miRNA,其中,p
‑
value表示该miRNA在患病样本中的表达与其在参考样本中表达的差异显著程度,通过计算miRNA在患病样本中的表达不符合在参考样本中的表达数据分布的期望差值并查表得到;FC表示该miRNA在患病样本中的表达与其在参考样本中表达的差异大小,按照下式计算得到:其中,分别表示在两个阶段样本中miRNA表达量的平均值;对于使用T
‑
test方法进行差异表达分析得到的miRNA,如果满足p
‑
value<0.05且|T
‑
statistic|>2,则认为该miRNA为DE miRNA,其中,T
‑
statistic表示在两个阶段样本中该miRNA的表达量有显著差异的概率,按照下式计算得到:其中,分别表示在两个阶段样本中miRNA表达量的方差;n表示两个阶段的样本总数;步骤3,构建共表达网络:对各阶段通过步骤2得到的DE miRNA,利用步骤1求得的miRNA表达量计算阶段内miRNA之间的相关系数并进行层次聚类,得到各阶段的共表达网络和共表达模块,具体过程如下:步骤a,构建miRNA共表达矩阵:按照下式计算得到miRNA共表达矩阵中的元素S
xy
:S
xy
=|corr(miRNA
x
,miRNA
y
)|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,S
xy
表示共表达矩阵的第x行y列元素值,miRNA
x
表示第x个DE miRNA,miRNA
y
表示第y个DE miRNA,x,y=1,2,
…
,n
m
,n
m
表示该阶段内包含的DE miRNA个数,corr表示计算两个DE miRNA的相关系数;步骤b,构建邻接矩阵:按照下式计算得到邻接矩阵中的邻接系数a
xy
:a
xy
=|S
xy
|
β
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,a
xy
表示邻接矩阵的第x行y列元素值,β为邻接函数的参数,取值为节点连接数的
对数与节...
【专利技术属性】
技术研发人员:陈伯林,邵慈,王腾,苗立珺,尚学群,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。