【技术实现步骤摘要】
一种基于机器学习的原代肿瘤细胞图片识别方法及系统
[0001]本专利技术属于生物医学图像处理领域,具体涉及一种适用于多类癌细胞的基于机器学习的原代肿瘤细胞图片识别方法及系统。
技术介绍
[0002]随着个体化医疗时代的到来,针对不同癌症病患个体的药物筛选与评价也迎来了新的挑战。抗癌药物筛选的一种做法是原代培养,即利用病患个体的穿刺组织、积液等在96孔板中对癌细胞进行培养,并加入多组药物,一段时间后观察各孔中存活癌细胞的多少。然而这种方式形成的培养环境中包含癌细胞、各种正常细胞与杂质,因此CCD拍照得到的照片中各种形态的细胞都存在。在这种情况下要判断哪些形态是癌细胞需要耗费大量的人力与时间,而且通常只能半定量甚至定性判断,无法准确地评估各组抗癌药物对癌细胞杀伤的效果。而传统图像识别的算法面对这类复杂的照片又难以取得很好的效果。
[0003]另外,在采用传统的图像识别算法对CCD拍照获得的图像进行识别时,通常会涉及到训练集的获取,而现有方法中对训练集的获取多采用人工标记方法,而采用人工标记会导致原始图像间可能存在形状、格 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的原代肿瘤细胞图片识别系统,其特征在于其包括:模型训练单元,用于将人工标记图片数据转换为供机器使用的训练集,并基于该训练集对构建的深度神经网络模型进行训练,得到适配于识别目标的深度神经网络模型参数;图片识别单元,用于基于深度神经网络模型参数对目标识别图像进行识别,并统计分析目标细胞面积大小、生长变化情况等,得到目标细胞图片的肿瘤细胞识别结果。2.如权利要求1所述的一种基于机器学习的原代肿瘤细胞图片识别系统,其特征在于:所述模型训练单元包括:数据集处理模块,用于将人工标记图片数据集转换为供机器使用的训练集;深度神经网络训练模块,用于将训练集进行深度神经网络训练从而得到适配于识别目标的深度神经网络模型参数。3.如权利要求1所述的一种基于机器学习的原代肿瘤细胞图片识别系统,其特征在于:所述图片识别单元包括:细胞图像识别模块,对目标识别图像进行密铺裁剪,并通过输入模型参数,对密铺裁切后的目标识别图像进行识别,得到图像识别结果;细胞区域计算模块,根据图像识别结果,统计分析目标细胞面积大小、生长变化情况,得到目标识别图像的肿瘤细胞识别结果。4.一种采用如权利要求1~3任一项所述基于机器学习的原代肿瘤细胞图片识别系统的识别方法,其特征在于包括以下步骤:1)对人工标记的原始图像进行处理,得到机器能够识别处理的训练集;2)基于步骤1)得到的训练集,采用基于深度学习中的深度残差网络为原型构建深度神经网络进行训练,得到适配于识别目标的深度神经网络模型参数;3)根据步骤2)得到的深度神经网络模型参数,对目标识别图像进行识别,得到图像识别结果;4)对图像识别结果进行统计分析,得到目标识别图像中目标细胞面积的大小、生长变化情况。5.如权利要求4所述的一种基于机器学习的原代肿瘤细胞图片识别方法,其特征在于:所述步骤1)中,对人工标记的原始图像进行处理,得到机器能够识别处理的训练集的方法,包括以下步骤:1.1)根据实际需求对原始图像进行裁剪,得到指定格式大小的目标细胞图片;1.2)对目标细胞图片内的人工标记进行统计识别,并根据人工标记的密度判定核心分布区;1.3)在核心分布区内使用无重复随机中心方法,截取n个预定大小的区域作为候选数据;1.4)对所有候选数据进行标准化处理,转为便于机器读取的训练集。6.如权利要求5所述的一种基于机器学习的原代肿瘤细胞图片识别方法,其特征在于:所述步骤1.2)中,对目标细胞图片内的人工标记进行统计识别,并根据人工标记的密度判定核心分布区的方法为:1.2.1)假设图像中存在任一标记点S,且该标记点S在图像中的坐标为(x,y),标记点S对应的随机变量为(X,Y),其密度函数记为f(x,y),横坐标X的边际密度记为f
X
(x),纵坐标Y
的边际密度记为f
Y
(y);1.2.2)根据随机变量X和Y的边际密度,找到满足预设阈值条件的标记点所在区域,将两者分别进行组合,得到的区域即为核心分布区;具体操作方法为:首先,对于随机变量X,找到所有满足P(X>a
*
)=0.75条件的a
*
,记为x1,x2,
…
,x
n
,对于给定的x
i
,有区间[x
i
,x
i+1
],i=1,2
…
n-1,在此区间中满足P(X>a
*
)>=0.75;其次,对于随机变量Y,找到所有满足P(Y>b
*
)=0.75条件的b
*
,记为y1,y2,
…
,y
n
,对于给定的y
i
【专利技术属性】
技术研发人员:张函槊,张成胜,
申请(专利权)人:北京基石生命科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。