基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法技术

技术编号:24451624 阅读:44 留言:0更新日期:2020-06-10 14:25
本发明专利技术公开了一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:(1)检测与慢性淋巴细胞白血病有关的抗原,计算抗原的荧光强度的置信区间界;(2)构建神经网络模型,其中模型输入为置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对神经网络模型进行训练;(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用神经网络模型给出参考识别结果。本发明专利技术借助于机器学习和大量历史数据,能够辅助临床医师准确识别是否属于慢性淋巴细胞白血病肿瘤细胞,从而提高临床诊断的效率和质量。

Machine learning based tumor cell recognition in chronic lymphocytic leukemia

【技术实现步骤摘要】
基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法
本专利技术涉及一种肿瘤细胞辅助识别方法,尤其涉及一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,属于医学检验

技术介绍
慢性淋巴细胞白血病(chroniclymphocyticleukemia,简称为CLL)是发生在中老年人群的一种造血系统恶性肿瘤,其最主要的特征是在外周血或骨髓中可以检测到具有特定免疫表型特征的恶性成熟B淋巴细胞。在医学临床上,可以利用流式细胞术检测CD19+肿瘤细胞上的多个抗原,通过人为分析这些抗原的表达特征并进行判断是否是CLL肿瘤细胞。典型的CLL肿瘤细胞免疫表型是:CD19+、CD5+、CD23+、CD200+、CD43+、CD10-、FMC7-;表面免疫球蛋白轻链(kappa/lambda)、CD20及CD79b弱表达(dim)。利用流式细胞术确认B细胞的克隆性,即B细胞表面限制性表达κ或λ轻链(κ∶λ>3∶1或<0.3∶1)或>25%的B细胞sIg不表达。由于CLL属于慢性淋巴细胞增殖性疾病,该类疾病除了CLL,还包括套细胞淋巴瘤、毛细胞白血病、边缘区淋巴瘤、滤泡细胞淋巴瘤,幼稚细胞淋巴瘤和淋巴浆细胞淋巴瘤/巨球蛋白血症等,这类疾病的肿瘤细胞免疫表型存在很多相交表达特征导致识别异常困难,而且CLL本身也有部分表现出非典型的免疫表型特征。因此,要确定该类细胞是否是CLL肿瘤细胞,即使是一个经多年训练的专业医师也存在10%以上的识别错误或者识别不确定性。在公布号为WO2017/073737的PCT申请中,东京大学提出了一种流式细胞仪,基于来自观测对象的光、电磁波等的信号进行分析而不进行图像化,通过机器学习优化光源系统或者检测系统之外,还利用机器学习对观测对象的分析、判别方法进行优化,从而能够快速且高精度地分析以及判别观测对象。通过将单细胞流式细胞术的各要点委托给机器学习,能够智能地测量,智能地分析、判别细胞信息的大数据。实现不受人类智慧偏见束缚的细胞分类法、不拍摄细胞“图像”的高速的细胞空间信息拍摄、分析法、根据对象自动优化的光拍摄法。另外,在公布号为WO2017/195772的PCT申请中,日本住友电气公司提出了一种肿瘤细胞检测方法,其具有以下分析步骤:基于通过对肿瘤细胞和血液中的其它细胞进行测定而得到的多个分光光谱,计算出用于通过统计方法、机器学习或模式识别来判定是否为肿瘤细胞的边界条件,并基于通过对所述细胞进行测定而得到的分光光谱和所述边界条件来判定所述细胞是否为肿瘤细胞。
技术实现思路
本专利技术所要解决的技术问题在于提供一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法。为实现上述目的,本专利技术采用下述的技术方案:一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,包括如下步骤:(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。其中较优地,所述步骤(1)中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。其中较优地,所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。其中较优地,所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。其中较优地,所述荧光强度的数据分布为对数正态分布。其中较优地,所述步骤(1)中,采用公式(1)和(2)计算荧光强度的置信区间界:1σ下界:1σ上界:μ×σ#(2)其中,m,v分别为对数正态分布的均值与方差。其中较优地,所述步骤(1)中,通过CD45/SSC双参数设门限取淋巴细胞后,采用CD19/CD45设门限取CD19+细胞分析不同抗原表达;通过内参细胞验证各种抗体的组合,并确定阴性淋巴细胞的位置。其中较优地,通过如下步骤验证各种抗体的组合,并确定阴性淋巴细胞的位置:采用CD19-淋巴细胞,为T和NK细胞作为内参阴性对照,确定CD10,CD19,FMC7,CD79b,CD20,CD23,CD22这7个通道的阴性表达位置;采用CD19-CD5-淋巴细胞为NK细胞的内参阴性对照,验证ECD通道的阴性表达位置。其中较优地,所述步骤(2)中,所述神经网络模型为三层,其中各个荧光强度数据首先在第一隐层中进行计算,然后输入第二隐层中进行进一步计算,最后经过Sigmoid激活函数计算后,输出参考识别结果。其中较优地,所述步骤(3)中,所述训练的步骤如下:(31)借助流式细胞仪,采集足够数量的两类患者的细胞荧光强度数据;(32)利用细胞荧光强度数据的均值与方差计算置信区间界;(33)将所述置信区间界作为模型输入,将病例是否属于慢性淋巴细胞白血病作为期望输出,训练所述神经网络模型。其中较优地,所述步骤(4)包括如下子步骤:(41)采集新患者的细胞荧光强度数据;(42)计算各种荧光强度的均值与方差,计算置信区间界;(43)将每种荧光强度的置信区间界输入训练好的神经网络模型中,得到参考识别结果。与现有技术相比较,本专利技术利用流式细胞仪采集到的两类患者(慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者)的荧光强度数据,训练得到神经网络模型。在神经网络模型训练完成之后,每当有需要诊断的患者,可以相应地采集其细胞的荧光强度数据,然后利用该神经网络模型即可给出参考识别结果,用于辅助临床医师进行判断。本专利技术采用神经网络模型实现,尽可能地避免引入过多的先验知识,并减少对特征工程的依赖。实验结果表明,本专利技术实现的分类精度可以达到95%以上,显著优于现有技术。附图说明图1为B细胞慢性淋巴增殖性疾病的免疫表型和细胞/分子/遗传学鉴别诊断流程图;其中,英文缩写含义如下:CLL:慢性淋巴细胞白血病,MCL:套细胞淋巴瘤,FL:滤泡淋巴瘤,HCL:毛细胞白血病,HCL-V:毛细胞白血病-变异型,WM:华氏巨球蛋白血症,MZL:边缘区淋巴瘤;图2为平均荧光强度(MFI)的分级示意图;图3为一例CLL流式细胞术所获得的荧光强度表达示意图;图4为某病例的部分细胞荧光强度分布直方图;图5为本专利技术所采用的神经网络模型的架构示意图。具体实施方式下面结合附图和本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于包括如下步骤:/n(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;/n(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;/n(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;/n(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。/n

【技术特征摘要】
1.一种基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于包括如下步骤:
(1)检测与慢性淋巴细胞白血病有关的抗原,计算所述抗原的荧光强度的置信区间界;
(2)构建神经网络模型,其中模型输入为所述置信区间界,模型输出为是否属于慢性淋巴细胞白血病的期望输出;
(3)利用采集到的慢性淋巴细胞白血病患者和非慢性淋巴细胞白血病患者的细胞荧光强度数据,对所述神经网络模型进行训练;
(4)对于需要诊断的新患者,采集他的细胞荧光强度数据,利用所述神经网络模型给出参考识别结果。


2.如权利要求1所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(1)中,将目的细胞进行免疫荧光染色,将染色后的细胞利用流式细胞仪进行检测,流式细胞仪性能参数设置,其中以淋巴细胞中的CD45阳性CD19阴性淋巴细胞为阴性对照,获取目的细胞待测抗原的阳性表达水平。


3.如权利要求2所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述目的细胞样本为已确诊的慢性淋巴细胞白血病或其他类型小B细胞淋巴瘤患者样本,样本采集后计数细胞并调整细胞浓度为0.5~1*109细胞/1ml。


4.如权利要求3所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述待测抗原是CD5,CD10,CD19,CD20,CD22,CD23,CD79B,CD81,CD103,CD200,FMC7,KAPPA和LAMBDA。


5.如权利要求4所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述荧光强度的数据分布为对数正态分布。


6.如权利要求5所述的慢性淋巴细胞白血病肿瘤细胞识别方法,其特征在于:
所述步骤(1)中,采用公式(1)和...

【专利技术属性】
技术研发人员:吴雨洁朱毅刘露陈梓灵王琰陈肖赵四书
申请(专利权)人:江苏省人民医院南京医科大学第一附属医院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1