【技术实现步骤摘要】
一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法
[0001]本专利技术属于计算机与生物医药交叉科学
,具体涉及一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法。
技术介绍
[0002]对药物的药效进行评价是药物开发过程中最核心的环节;目前对药物药效的评价采用较多的仍旧是传统的动物试验模型、二维细胞培养技术及其与机器学习相结合的技术,其中,动物试验模型由于与人类存在基因组和生理上的区别,例如代谢速率、器官大小和结构、免疫系统、代谢通路等,导致药物在两者间的结果存在诸多不一致的可能性;近年来动物模型的准确度愈发受到质疑,结合动物权益的保护愈发被重视,动物模型在药物研发管线的必要性也逐渐降低。而二维细胞培养技术虽然基于细胞系或人源原代细胞培养,但是缺少体内真实微环境中存在的某些重要细胞类型,缺乏体内器官层面必要的细胞间协同和相互作用,尤其是在肿瘤细胞相关的研究中缺乏必要的肿瘤微环境相互作用的考量,导致二维细胞培养模型不能完全模拟体内器官层面的疾病发展情况,影响结果的可靠性;
[0003]相较于二维细胞培养只能提供单层细胞的表达信息而难以模拟复杂的组织结构和功能,器官芯片与类器官技术能够构成有效的三维结构细胞,从而呈现出更接近人体内器官层级的表达特质,可以更好地模拟体内器官中细胞类型、细胞
‑
细胞相互作用、组织结构和细胞分化等结构功能。对于药物效应的预测,也可以尽可能还原体内器官在药物作用下的代谢、转运、毒性等,因此,采用器官芯片或类器官芯片进行药物研发管线中候选化合物的 ...
【技术保护点】
【技术特征摘要】
1.一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,包括:步骤1、构建器官芯片样本库所述器官芯片样本库中存储有不同来源的肿瘤类器官的样本信息及其对应的临床信息;步骤2、构建湿实验数据库从器官芯片样本库中选择进行湿实验的器官芯片样本及其对应的至少一种化合物,器官芯片样本数据库中对应的化合物的信息确定湿实验过程中化合物的基准浓度,并基于该化合物基准浓度设立浓度梯度对器官芯片进行处理,获得湿实验数据结果,构建湿实验数据库;所述湿实验数据库中存储有湿实验信息,所述湿实验信息包括湿实验基础信息和湿实验数据结果;步骤3、 数据的预处理、特征提取及向量化:将器官芯片数据库中信息和湿实验数据库中的湿实验信息以文本、数值和图像进行区分归类,划分为文本型数据、数值型数据和图像型数据;然后分别对文本型数据、数值型数据和图像型数据进行预处理、特征提取及向量化,使之转化成计算机可识别的形式;步骤4、特征拼接模型的构建;使用特征拼接机制将文本型数据特征、数值型数据特征和图像型数据特征的进行组合,构建特征拼接模型;步骤5、对特征拼接模型进行训练,构建杀伤有效性预测模型,并进行验证评估;步骤6、对特征拼接模型进行训练,构建EC50预测模型,并进行验证评估;步骤7、利用构建的杀伤有效性预测模型和EC50预测模型进行杀伤有效性和EC50值的预测。2.根据权利要求1所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,步骤1中,所述不同来源的肿瘤类器官包括由脱敏处理后临床样本原代提取的肿瘤类器官、从其他样本库获得的肿瘤类器官、从干细胞诱导分化的特定类型的肿瘤类器官、细胞系构建的肿瘤类器官中的一种或多种;步骤2中,所述湿实验数据结果包括组学检测数据结果、活性检测数据结果、图像数据结果中的一种或几种;其中,图像数据又包括带时间信息的明场三维成像数据和/或带时间信息的荧光染色图像数据。3.根据权利要求1所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,步骤3中,文本型数据包括器官芯片数据库中信息数据和湿实验数据库中的湿实验基础信息;数值型数据包括湿实验数据结果信息中的组学检测数据结果、活性检测数据结果中的一种或几种;图像型数据包括湿实验数据结果信息中的图像数据结果。4.根据权利要求3所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,文本型数据的预处理、特征提取及向量化,具体包括:首先对文本形式的信息中存在的包括明显异常输入、缺失在内的不合理值进行手动预处理;然后使用自然语言工具对文本
中的语气词、标点符号、不规范用词进行清洗;接着使用scikit
‑
learn进行特征提取,将文本信息特征结构化,并通过One
‑
Hot编码处理离散的特征,和通过Word2Vec处理常规频次文本型特征,将文本数据转化为模型可以处理的数值型向量;数值型数据结果的预处理、特征提取及向量化,包括:首先采用StandardScaler库中的z_score_scaler.fit_transform()函数的Z
‑
Score转换进行数据标准化,然后经归一化处理,将数值类特征进行向量化;其中部分特征数据进行范围化分类操作,并转化为等级分类标签;图像型数据结果的预处理、特征提取及向量化,包括:首先将图像型数据结果进行图像预处理,然后构建类器官影像预训练模型,并采用所构建的类器官影像预训练模型中解码器模块提取预处理后的图像数据中的图像特征数据并向量化。5.根据权利要求4所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,图像型数据结果的图像预处理包括图像裁剪和圈选、图像尺寸调整、图像旋转翻转、图像暗角处理、图像色彩调整、标准化像素值中的一项或几项;图像型数据的特征提取及向量化:构建类器官影像预训练模型,并完成训练和验证后,采用类器官影像预训练模型中编码层的三维卷积神经网络的多层卷积和池化操作提取图像更低纬度的特征表征,实现特征提取及向量化,具体包括:步骤b
‑
1、类器官影像预训练模型训练数据集构建以步骤3图像型数据预处理后的所有图像数据为初始训练集,将初始训练集中预处理后图像数据进行随机掩码,并在初始训练集中删除掩码对应子结构的像素向量数据,获得去除掩码部分子结构的剩余图像数据,然后将去除掩码部分子结构的剩余图像数据与掩码子结构像素向量数据构成训练数据集,用于对类器官影像预训练模型的训练;步骤b
‑
2、类器官影像预训练模型的构建首先,将掩码处理完毕的三维空间向量图像,使用卷积核在三个维度上滑动进行的卷积运算,结合最大池化层筛选最大特征值作为输出,来逐层减小特征图的空间尺寸,保留主要特征,在解码层进行3D转置卷积,将空间尺寸放大恢复至池化处理前的原始尺寸;接着使用跳跃连接将池化前的数据与反卷积后的数据直接拼接,将低层次的特征信息传递到解码器中,以辅助恢复细节和位置信息,最终,通过最后一层卷积层输出与输入相同尺寸的图像结果,从而完成类器官影像预训练模型的设计;然后以随机掩码处理后的子结构信息补全为目标,以步骤b
‑
1中的去除掩码部...
【专利技术属性】
技术研发人员:胡天牧,于文龙,顾忠泽,
申请(专利权)人:江苏运动健康研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。