一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统技术方案

技术编号:37344119 阅读:17 留言:0更新日期:2023-04-22 21:36
本发明专利技术公开了一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统,对妊娠早期对象的血液样本进行cfRNA测序,提取血液样本的cfRNA测序表达量;对血液样本cfRNA测序表达量进行数据预处理,筛选表征妊娠期血压值升高具有差异的cfRNA测序数据指标,同时建立训练数据集和验证数据集;建立FCDN神经网络模型;利用训练数据集对FCDN神经网络模型进行训练,利用验证数据集对训练好的FCDN神经网络模型进行验证得到最优的FCDN神经网络模型,利用最优的FCDN神经网络模型得到妊娠期血压值升高概率结果。概率结果。概率结果。

【技术实现步骤摘要】
一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统


[0001]本专利技术属于生物测序数据处理
,具体涉及一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统。

技术介绍

[0002]血液、尿液、唾液等体液中存在着大量游离的核酸小片段DNA(cell

free DNA)和RNA(cell

free RNA)等生物标志物,在肿瘤早筛、肿瘤用药、疗效评估和复发监测方面有着重要的应用价值。其中最受关注的是循环游离RNA(circulating cell

free RNA,cfRNA),包括微小RNA(microRNA,miRNA),长链非编码RNA(long non

coding RNA,lncRNA),环状RNA(circular RNA,circRNA)、运载RNA(transfer RNA)和信使RNA(message RNA,mRNA)等几乎所有类型的RNA。
[0003]已有研究报道cfRNA用于一些实体肿瘤,包括乳腺癌、结直肠癌、滤泡性淋巴瘤和肝细胞癌等的早期诊断。cfRNA较少受到衰老细胞释放DNA的影响,在体液中丰度高,在疾病预测、诊断、预后判断等领域有着重要的应用价值。
[0004]在医学研究中,通常将临床标本委托拥有测序仪器的公司进行cfRNA测序,交付的结果中通常包含至少三千余种cfRNA的变化量。受限于专业背景的不同,获得测序数据后,通常仅采用SPSS这一类统计学软件根据显著性差异筛选出某个cfRNA,随后针对这一个cfRNA展开相关的实验。

技术实现思路

[0005]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于FCDN神经网络及cfRNA的血压数据预测方法及系统,利用深度神经网络进行数据学习、拟合,以实现cfRNA测序数据整体解读,用于解决PE现象在妊娠早期无法量化预测的技术问题。
[0006]本专利技术采用以下技术方案:
[0007]一种基于FCDN神经网络及cfRNA的血压数据预测方法,包括以下步骤:
[0008]S1、对妊娠早期对象的血液样本进行cfRNA测序,提取血液样本的cfRNA测序表达量;
[0009]S2、对步骤S1得到的血液样本cfRNA测序表达量进行数据预处理,筛选表征妊娠期血压值升高具有差异的cfRNA测序数据指标,同时建立训练数据集和验证数据集;
[0010]S3、建立FCDN神经网络模型;
[0011]S4、利用步骤S2得到的训练数据集对步骤S3建立的FCDN神经网络模型进行训练,利用步骤S2得到的验证数据集对训练好的FCDN神经网络模型进行验证得到最优的FCDN神经网络模型,利用最优的FCDN神经网络模型得到妊娠期血压值升高概率结果。
[0012]具体的,步骤S1中,血液样本cfRNA测序表达量具体为:
[0013][0014]其中,x_train[i]为cfRNA表达量训练数据集,x_test[i]为cfRNA表达量验证数据集,EF[i]为妊娠期血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为正常组实际测序数据预处理后的cfRNA表达量,M为训练数据集样本生成量,Q为验证数据集样本生成量。
[0015]具体的,步骤S2中,数据预处理具体为:
[0016]剔除PE与非PE组表达量均含0项;排除PE组cfRNA分布区间与非PE组分布区间100%重叠项;计算PE组cfRNA分布区间与非PE组分布区间均值偏差量;按分布区间重叠比阈值筛选cfRNA显著性差异测序数据指标。
[0017]进一步的,筛选cfRNA显著性差异测序数据指标具体为:
[0018]剔除测序数据中PE组与非PE组中均含0表达量的cfRNA测序量;剔除测序数据中PE组与非PE组测序量100%区间重叠的cfRNA;剔除测序数据中PE组与非PE组测序量均值偏差小于10%的cfRNA。
[0019]具体的,步骤S2中,训练与验证cfRNA数据集对应的训练数据集和验证数据集具体为:
[0020]根据筛选后cfRNA测序向量的幅值分布,利用高斯随机数函数生成模拟测序样本,得到训练数据集和验证数据集,训练数据集和验证数据集分别包括cfRNA和血压升高概率贡献数据;血压升高概率贡献数据具体为:
[0021][0022][0023]其中,i∈[1,2,3,

N],y_train[i]为血压升高概率贡献数据训练数据集,y_test[i]为血压升高概率贡献数据验证数据集,,EF[i]为为妊娠期血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为为正常组实际测序数据预处理后的cfRNA表达量,avg()为求取均值运算。
[0024]具体的,步骤S3中,FCDN神经网络模型包括:
[0025]卷积层Conv:进行前级特征粗提取处理;
[0026]全连接层Dense:与并联支路add运算构成一种残差网络结构,将前级多维特征图整合重组;
[0027]特征精提取模块TU:由批正则化运算BN;
[0028]卷积层Conv:带有的Relu为非线性激活函数;
[0029]DP:为神经元比例舍弃运算与MP最大池化运算;
[0030]利用卷积层Conv与全连接层Dense组合前级特征图张量,并作为输出层输出表征PE发病风险的(1,N,M)维概率向量。
[0031]具体的,步骤S4中,利用训练数据集对FCDN神经网络模型进行训练具体为:
[0032]损失函数loss表征训练预测输出值y_pred与标准值y_train存在的偏差,将cfRNA表达量数据集x_train分批输入至FCDN神经网络模型中,得到对应的预测概率向量y_pred与PE发病概率真值y_train求取MAE损失值;然后通过优化器Adam对FCDN神经网络模型的参数进行优化更新,通过多次循环迭代计算,使预测量y_pred与标记量y_train损失值Loss<T,阈值T=0.02,完成训练。
[0033]进一步的,损失函数loss采用平均绝对误差MAE,优化器Adam采用学习率衰减机制动态调节模型学习率参数LR,具体为:
[0034][0035][0036]其中,M为总样本数量,y[i]为训练数据集中妊娠期血压值升高概率向量,x[i]为训练数据集中cfRNA表达量向量,FCDN()为深度神经网络模型预测函数,loss为损失值,a,b,c为衰减系数。
[0037]具体的,步骤S4中,利用验证数据集对训练好的FCDN神经网络模型进行验证具体为:
[0038]将训练数据集以外的验证数据x_test或其他妊娠早期对象cfRNA测序样本数据输入已训练的FCDN神经网络模型进行预测,将得到的y_pred作为最终的妊娠期血压值升高概率向量;对概率向量中各cfRNA贡献的概率值求取平均值,得到个体最终的妊本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,包括以下步骤:S1、对血液样本进行cfRNA测序,提取血液样本的cfRNA测序表达量;S2、对步骤S1得到的血液样本cfRNA测序表达量进行数据预处理,筛选表征血压值升高具有差异的cfRNA测序数据指标,同时建立训练数据集和验证数据集;S3、建立FCDN神经网络模型;S4、利用步骤S2得到的训练数据集对步骤S3建立的FCDN神经网络模型进行训练,利用步骤S2得到的验证数据集对训练好的FCDN神经网络模型进行验证得到最优的FCDN神经网络模型,利用最优的FCDN神经网络模型得到血压值升高概率结果。2.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S1中,血液样本cfRNA测序表达量具体为:其中,x_train[i]为cfRNA表达量训练数据集,x_test[i]为cfRNA表达量验证数据集,EF[i]为血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为正常组实际测序数据预处理后的cfRNA表达量,M为训练数据集样本生成量,Q为验证数据集样本生成量。3.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S2中,数据预处理具体为:剔除PE与非PE组表达量均含0项;排除PE组cfRNA分布区间与非PE组分布区间100%重叠项;计算PE组cfRNA分布区间与非PE组分布区间均值偏差量;按分布区间重叠比阈值筛选cfRNA显著性差异测序数据指标。4.根据权利要求3所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,筛选cfRNA显著性差异测序数据指标具体为:剔除测序数据中PE组与非PE组中均含0表达量的cfRNA测序量;剔除测序数据中PE组与非PE组测序量100%区间重叠的cfRNA;剔除测序数据中PE组与非PE组测序量均值偏差小于10%的cfRNA。5.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S2中,训练与验证cfRNA数据集对应的训练数据集和验证数据集具体为:根据筛选后cfRNA测序向量的幅值分布,利用高斯随机数函数生成模拟测序样本,得到训练数据集和验证数据集,训练数据集和验证数据集分别包括cfRNA和血压升高概率贡献数据;血压升高概率贡献数据具体为:
其中,i∈[1,2,3,

N],y_train[i]为血压升高概率贡献数据训练数据集,y_test[i]为血压升高概率贡献数据验证数据集,,EF[i]为为妊娠期血压升高样本组实际测序数据预处理后的cfRNA表达量,RF[i]为为正常组实际测序数据预处理后的cfRNA表达量,avg()为求取均值运算。6.根据权利要求1所述的基于FCDN神经网络及cfRNA的血压数据预测方法,其特征在于,步骤S3中,FCDN神经网络模型包括:卷积层Conv:进行前级特征粗提取处...

【专利技术属性】
技术研发人员:王政赵卓刘进军李兵
申请(专利权)人:西安交通大学口腔医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1