【技术实现步骤摘要】
一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统
[0001]本专利技术属于生物测序数据处理
,具体涉及一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统。
技术介绍
[0002]血液、尿液、唾液等体液中存在着大量游离的核酸小片段DNA(cell
‑
free DNA)和RNA(cell
‑
free RNA)等生物标志物,在肿瘤早筛、肿瘤用药、疗效评估和复发监测方面有着重要的应用价值。其中最受关注的是循环游离RNA(circulating cell
‑
free RNA,cfRNA),包括微小RNA(microRNA,miRNA),长链非编码RNA(long non
‑
coding RNA,lncRNA),环状RNA(circular RNA,circRNA)、运载RNA(transfer RNA)和信使RNA(message RNA,mRNA)等几乎所有类型的RNA。
[0003]已有研究报道cfRNA用于一些实体肿瘤,包括乳腺癌、结直肠癌、滤泡性淋巴瘤和肝细胞癌等的早期诊断。cfRNA较少受到衰老细胞释放DNA的影响,在体液中丰度高,在疾病预测、诊断、预后判断等领域有着重要的应用价值。
[0004]在医学研究中,通常将临床标本委托拥有测序仪器的公司进行cfRNA测序,交付的结果中通常包含至少三千余种cfRNA的变化量。受限于专业背景的不同,获得测序数据后,通常仅采用SPSS这一类统计学软件根据显著性差异 ...
【技术保护点】
【技术特征摘要】
1.一种基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,包括以下步骤:S1、对血液样本进行cfRNA测序,提取血液样本的cfRNA测序表达量;S2、对步骤S1得到的血液样本cfRNA测序表达量进行数据预处理,筛选表征血压值升高具有差异的cfRNA测序数据指标,同时建立训练数据集和验证数据集;S3、建立FCDN神经网络模型;S4、利用步骤S2得到的训练数据集对步骤S3建立的FCDN神经网络模型进行训练,利用步骤S2得到的验证数据集对训练好的FCDN神经网络模型进行验证得到最优的FCDN神经网络模型,利用最优的FCDN神经网络模型得到血压值升高概率结果。2.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S1中,血液样本cfRNA测序表达量具体为:其中,x_train[i]为cfRNA表达量训练数据集,x_test[i]为cfRNA表达量验证数据集,EF[i]为血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为正常组实际测序数据预处理后的cfRNA表达量,M为训练数据集样本生成量,Q为验证数据集样本生成量。3.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S2中,数据预处理具体为:剔除PE与非PE组表达量均含0项;排除PE组cfRNA分布区间与非PE组分布区间100%重叠项;计算PE组cfRNA分布区间与非PE组分布区间均值偏差量;按分布区间重叠比阈值筛选cfRNA显著性差异测序数据指标。4.根据权利要求3所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,筛选cfRNA显著性差异测序数据指标具体为:剔除测序数据中PE组与非PE组中均含0表达量的cfRNA测序量;剔除测序数据中PE组与非PE组测序量100%区间重叠的cfRNA;剔除测序数据中PE组与非PE组测序量均值偏差小于10%的cfRNA。5.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S2中,训练与验证cfRNA数据集对应的训练数据集和验证数据集具体为:根据筛选后cfRNA测序向量的幅值分布,利用高斯随机数函数生成模拟测序样本,得到训练数据集和验证数据集,训练数据集和验证数据集分别包括cfRNA和血压升高概率贡献数据;血压升高概率贡献数据具体为:
其中,i∈[1,2,3,
…
N],y_train[i]为血压升高概率贡献数据训练数据集,y_test[i]为血压升高概率贡献数据验证数据集,,EF[i]为为妊娠期血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为为正常组实际测序数据预处理后的cfRNA表达量,avg()为求取均值运算。6.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S3中,FCDN神经网络模型包括:卷积层Conv:进行前级特征粗提取处...
【专利技术属性】
技术研发人员:王政,赵卓,刘进军,李兵,
申请(专利权)人:西安交通大学口腔医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。