System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于DNA定量和时间序列分析的宫颈癌分级方法技术_技高网

一种基于DNA定量和时间序列分析的宫颈癌分级方法技术

技术编号:40318005 阅读:12 留言:0更新日期:2024-02-07 21:00
本发明专利技术公开一种基于DNA定量和时间序列分析的宫颈癌分级方法,包括:基于宫颈TCT图像,定量计算得到宫颈细胞的DNA含量,在样本内部按照降序排列,形成DNA时间序列;通过IF方法将DNA时间序列分解为本征模函数IMFs,对一组时间序列,计算得到该组时序数据对应的IMFs;将IMFs特征输入CNN网络,在卷积层以三维数组的形式接受DNA时间序列,该层的输出特征图由每一个卷积核与输入,卷积生成;将CNN中的BN层和激活层作为提取的DNA时间序列特征;DNA时间序列特征作为输入数据,通过有监督机器学习分类器或半监督神经网络求解宫颈癌组织的分级状态。该方法具备高敏感性、高特异性、强鲁棒性、密集信息度。

【技术实现步骤摘要】

本专利技术属于宫颈癌诊断,具体涉及一种基于dna定量和时间序列分析的宫颈癌分级方法。


技术介绍

1、随着计算机技术的发展,数字病理成像技术为医学带来了极大的便利,高质量的图像为疾病的分析与诊断提供了数据基础。宫颈细胞tct(thinprep cytologic test,薄层液基细胞学检查)技术作为宫颈癌早期筛查方法的一种,目前在全世界范围内受到了高度的认可,是国际领先的一种宫颈防病变细胞学检查技术。另外基于细胞的dna定量分析对于宫颈癌和其他恶性肿瘤的诊断和评价具有重要的意义。早期宫颈癌无症状,也不具备肉眼可观的病灶,但癌前病变(precancerous lesions)通常伴随着部分宫颈细胞的异化,这会导致其dna含量发生变化。正常生理状态下绝大多数人体细胞都处于二倍体阶段,宫颈异常增殖细胞微观表现为染色体畸形断裂(abnormal fracture)或基因突变(gene mutation),出现dna结构、含量及染色体数量改变,即产生单条或多条染色体,成为异倍体,宏观最终发展为细胞形态异常和恶性肿瘤(malignant tumor)。宫颈细胞微观遗传物质数量、宏观生理状态和宫颈癌发展阶段等指标与dna含量密切相关,细胞dna含量与tct图像特征之间可以由定量关系实现转化,通过测量tct细胞图像的形态、色度、纹理等特征,与dna含量实现拟合,就能够量化估计宫颈癌生长阶段等关键的物理和生理参数。

2、因此,利用tct图像对宫颈细胞dna定量描述是组织到分子的映射过程,通过图像分析模型避免了成本高昂、效率低下的精密测量手段。一般采用相对测量的方法,依据lambert-beer定律对细胞图像进行计算,宫颈细胞核dna与细胞质的吸光度不同,图像灰度值存在差异,经过近些年来的探索和研究,基于流式细胞术(flow cytometry,fcm)和图像细胞光度术(image cytophotometry,icm)在宫颈癌tct图像数据分析研究中已经逐渐成为主流方向。其中光密度(optical density,od)对宫颈癌变引起的生物样本透射率(transmissivity)变化比较敏感,因此是最常用的定量测量参数。与正常宫颈组织相比,癌前病变和cin级别的od数值会升高,反映倍体异常细胞扩增引起的组织生理和病理改变。这一现象虽然经过了宫颈癌临床试验结果的验证,但是该方法中比如光密度参数od具备非常大的测量误差和不确定度的问题仍然在限制该方法广泛应用于宫颈癌诊断。

3、由于获取的宫颈原图难以区分病变特征,目前临床上通用的操作是在宫颈转化区涂抹醋酸和碘溶液以观察病理变化确定病变类型。但是,阴道镜检查也有比较明显的缺点,随着图像数据和工作量的增加,通过人工阅片的方式容易造成误诊、漏诊且不同医师的专业水平会造成敏感性差异,这都不利于病变的筛查。

4、虽然tct图像数据分析框架具备成为一种理想宫颈癌检测手段的潜力,但是,一般而言,tct样本获取是对宫颈区域生物材料的随机采样,癌前病变的宫颈异常细胞数量较少,存在增殖细胞未能由筛查系统检出的可能性;一般来说,cin2及以上阶段宫颈样本由tbs报告检出的异常细胞数目也仅为个位数或数十个,这也就导致了假阴性样本的发生。

5、另外,对于光学测量的dna定量检测技术,即使诸如光密度等参数对宫颈癌变引起的生物样本透射率(transmissivity)变化比较敏感,但利用基于光学测量的dna定量检测技术,光密度参数od仍然具备非常大的测量误差和不确定度,这种偏差极大地限制了dna定量分析在宫颈癌诊断和筛查中的广泛应用。


技术实现思路

1、为了解决现有技术中的不足,本专利技术旨在提供一种基于dna定量和时间序列分析的宫颈癌分级方法。

2、本专利技术提供一种基于dna定量和时间序列分析的宫颈癌分级方法,包括如下步骤:

3、(1)dna时间序列的获得

4、基于宫颈tct图像,定量计算得到宫颈细胞的dna含量,在样本内部按照降序排列,形成dna时间序列;

5、(2)dna时间序列特征的提取

6、通过if方法将dna时间序列分解为本征模函数imfs,对一组时间序列,计算得到该组时序数据对应的imfs;

7、将imfs特征输入cnn网络,在卷积层以三维数组的形式接受dna时间序列,该层的输出特征图由每一个卷积核与输入,卷积生成;

8、将cnn中的bn层和激活层作为提取的dna时间序列特征;

9、(3)宫颈癌分级的求解

10、所述dna时间序列特征作为输入数据,通过有监督机器学习分类器或半监督神经网络求解宫颈癌组织的分级状态。

11、进一步地,将cnn中的bn层和激活层作为提取的dna时间序列特征中,采用并行化的方法进行特征选择和特征计算;

12、优选地,若多个特征返回了一个特定的自回归模型(ar)系数,该ar模型仅拟合一次并共享权重参数;

13、优选地,通过一个或多个关联时间序列中的时间序列特征扩展单变量属性的设计矩阵,或从一组时间序列中生成设计矩阵。

14、进一步地,所述有监督机器学习分类器或半监督神经网络选自svm(supportvector machine)、naive bayes、rf(random forest)、knn(k-nearestneighbor)或并行lstm-fcn(long short term memory fully convolutional network)模型。

15、进一步地,采用并行lstm-fcn(long short term memory fully convolutionalnetwork)求解宫颈癌组织的分级状态,所述并行lstm-fcn模型由全卷积网络模块和lstm模块组成;

16、所述全卷积网络模型包含2个时域卷积块,分别采用128和256大小的滤波核,每个时域卷积块都附带batch归一化处理和leaky relu激活函数,最后一层为全局池化层(global pooling);

17、所述lstm模块包含lstm层和dropout层;

18、连接所述全局池化层(global pooling)和lstm层的输出并输入到softmax层分类。

19、进一步地,采用维度shuffle按照所述dna时间序列特征数据尺寸顺序训练模型,根据分段随机抽样的比例设置训练集、验证集和测试集;

20、优选地,设定采样比为1/8,将抽样的数据用于训练,采用随机梯度下降法,用给定的数据集训练五个初始值不同的网络,具有最优网络参数的模型将被保存。

21、进一步地,注意力机制被用于序列与文本分类,即上下文向量c以目标序列y作为条件,上下文向量ci依赖于一系列注释(h1,...,htx),此时编码器将输入序列映射到其中,每个注释hi包含关于整个输入序列的信息,关注输入序列的第i个单词的部分,上下文向量ci计算为本文档来自技高网...

【技术保护点】

1.一种基于DNA定量和时间序列分析的宫颈癌分级方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的宫颈癌分级方法,其特征在于,将CNN中的BN层和激活层作为提取的DNA时间序列特征中,采用并行化的方法进行特征选择和特征计算;

3.根据权利要求1所述的宫颈癌分级方法,其特征在于,所述有监督机器学习分类器或半监督神经网络选自SVM(SupportVector Machine)、Naive Bayes、RF(random forest)、KNN(K-NearestNeighbor)或并行LSTM-FCN(Long Short Term Memory FullyConvolutional Network)模型。

4.根据权利要求1所述的宫颈癌分级方法,其特征在于,采用并行LSTM-FCN(LongShort Term Memory Fully Convolutional Network)求解宫颈癌组织的分级状态,所述并行LSTM-FCN模型由全卷积网络模块和LSTM模块组成;

5.根据权利要求4所述的宫颈癌分级方法,其特征在于,采用维度Shuffle按照所述DNA时间序列特征数据尺寸顺序训练模型,根据分段随机抽样的比例设置训练集、验证集和测试集;

6.根据权利要求4所述的宫颈癌分级方法,其特征在于,注意力机制被用于序列与文本分类,即上下文向量C以目标序列y作为条件,上下文向量ci依赖于一系列注释(h1,...,hTx),此时编码器将输入序列映射到其中,每个注释hi包含关于整个输入序列的信息,关注输入序列的第i个单词的部分,上下文向量ci计算为这些注释hi的加权和,如下式(1):

7.根据权利要求1所述的宫颈癌分级方法,其特征在于,宫颈细胞的DNA含量通过DNA定量计算与矫正获得,具体包括:利用无位置偏差的图像配准方法匹配组织病理学图像与DNA时间序列图像;逐步减弱为消除离心参数和外界光源造成偏差的映射函数权重,实现通用的DNA定量计算与矫正;

8.一种基于DNA定量和时间序列分析的宫颈癌分级系统,其特征在于,包括:

9.根据权利要求8所述的宫颈癌分级系统,其特征在于,所述DNA时间序列特征提取模型的规则为:

10.根据权利要求8所述的宫颈癌分级系统,其特征在于,所述宫颈癌分级的求解模型选自有监督机器学习分类器或半监督神经网络;

...

【技术特征摘要】

1.一种基于dna定量和时间序列分析的宫颈癌分级方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的宫颈癌分级方法,其特征在于,将cnn中的bn层和激活层作为提取的dna时间序列特征中,采用并行化的方法进行特征选择和特征计算;

3.根据权利要求1所述的宫颈癌分级方法,其特征在于,所述有监督机器学习分类器或半监督神经网络选自svm(supportvector machine)、naive bayes、rf(random forest)、knn(k-nearestneighbor)或并行lstm-fcn(long short term memory fullyconvolutional network)模型。

4.根据权利要求1所述的宫颈癌分级方法,其特征在于,采用并行lstm-fcn(longshort term memory fully convolutional network)求解宫颈癌组织的分级状态,所述并行lstm-fcn模型由全卷积网络模块和lstm模块组成;

5.根据权利要求4所述的宫颈癌分级方法,其特征在于,采用维度shuffle按照所述dna时间序列...

【专利技术属性】
技术研发人员:郏东耀张传旺李子琦和子豪吴能凯
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1