一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法技术

技术编号:38527087 阅读:10 留言:0更新日期:2023-08-19 17:02
本发明专利技术涉及一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,包括如下步骤:步骤1、构建器官芯片样本库;步骤2、构建湿实验数据库;步骤3、数据的预处理、特征提取及向量化:步骤4、特征拼接模型的构建;步骤5、对特征拼接模型进行训练,构建杀伤有效性预测模型,并进行验证评估;步骤6、对特征拼接模型进行训练,构建EC50预测模型,并进行验证评估;步骤7、进行杀伤有效性和EC50值的预测。本发明专利技术将器官芯片技术与深度学习技术相结合进行抗肿瘤药物的药效预测,实现了干湿实验的融合,在尽可能贴近人体内器官层面系统性药物作用的同时,实现高通量、自动化、规避伦理风险的数据产出。据产出。据产出。

【技术实现步骤摘要】
一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法


[0001]本专利技术属于计算机与生物医药交叉科学
,具体涉及一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法。

技术介绍

[0002]对药物的药效进行评价是药物开发过程中最核心的环节;目前对药物药效的评价采用较多的仍旧是传统的动物试验模型、二维细胞培养技术及其与机器学习相结合的技术,其中,动物试验模型由于与人类存在基因组和生理上的区别,例如代谢速率、器官大小和结构、免疫系统、代谢通路等,导致药物在两者间的结果存在诸多不一致的可能性;近年来动物模型的准确度愈发受到质疑,结合动物权益的保护愈发被重视,动物模型在药物研发管线的必要性也逐渐降低。而二维细胞培养技术虽然基于细胞系或人源原代细胞培养,但是缺少体内真实微环境中存在的某些重要细胞类型,缺乏体内器官层面必要的细胞间协同和相互作用,尤其是在肿瘤细胞相关的研究中缺乏必要的肿瘤微环境相互作用的考量,导致二维细胞培养模型不能完全模拟体内器官层面的疾病发展情况,影响结果的可靠性;
[0003]相较于二维细胞培养只能提供单层细胞的表达信息而难以模拟复杂的组织结构和功能,器官芯片与类器官技术能够构成有效的三维结构细胞,从而呈现出更接近人体内器官层级的表达特质,可以更好地模拟体内器官中细胞类型、细胞

细胞相互作用、组织结构和细胞分化等结构功能。对于药物效应的预测,也可以尽可能还原体内器官在药物作用下的代谢、转运、毒性等,因此,采用器官芯片或类器官芯片进行药物研发管线中候选化合物的药效层面的研究,对获得更为可靠的测试数据、减少动物实验数量具有重要意义。
[0004]得益于数据处理和计算能力的增强,机器学习领域技术飞速发展,在药物开发方向上开展了应用。虽然机器学习技术的介入有效提升了药物筛选的效率,但是主要是与通量数据较低的二维细胞培养技术相结合进行药物筛选的,且机器学习和早期深度学习模型缺乏足够的可解释性,也缺乏高通量的生物学和临床数据的支撑。开源程度低的临床和实验数据最终导致机器学习可利用的数据通量有限,模型准确度不及预期。
[0005]而相较于二维细胞培养技术而言,器官芯片与类器官芯片所获得的数据类型更为复杂,不仅包括代谢组学数据、活性数据还包括带时间序列的各种模态的图像数据,而对于复杂多样的高通量数据尤其其中的高内涵图像数据目前尚无有效的数据处理方式,因此至今无法将器官芯片技术与深度学习技术相结合,用于化合物药效预测评估中。

技术实现思路

[0006]本专利技术的目的在于克服现有技术中的缺陷,提供了一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其将器官芯片技术与深度学习技术相结合进行抗肿瘤药物的药效预测,实现了干湿实验的融合,在尽可能贴近人源体内器官层面系统性药物作用的同时,实现高通量、自动化、规避伦理风险的数据产出。
[0007]为实现上述目的,本专利技术所采取的技术方案如下:
[0008]一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,包括如下步骤:
[0009]步骤1、构建器官芯片样本库
[0010]所述器官芯片样本库中存储有不同来源的肿瘤类器官的样本信息及其对应的临床信息;
[0011]步骤2、构建湿实验数据库
[0012]从器官芯片样本库中选择进行湿实验的器官芯片样本及其对应的至少一种化合物(来源于治疗方案中),器官芯片样本数据库中对应的化合物的公开信息确定湿实验过程中化合物的基准浓度,并基于该化合物的基准浓度设立浓度梯度对器官芯片进行处理,获得湿实验数据结果,构建湿实验数据库;所述湿实验数据库中存储有湿实验信息,所述湿实验信息包括湿实验基础信息和湿实验数据结果;
[0013]步骤3、数据的预处理、特征提取及向量化:将器官芯片数据库中信息和湿实验数据库中的湿实验信息以文本、数值和图像进行区分归类,划分为文本型数据、数值型数据和图像型数据;然后分别对文本型数据、数值型数据和图像型数据进行预处理、特征提取及向量化,使之转化成计算机可识别的形式;
[0014]步骤4、特征拼接模型的构建;
[0015]使用特征拼接机制将文本型数据特征、数值型数据特征和图像型数据特征的进行组合,构建特征拼接模型;
[0016]步骤5、对特征拼接模型进行训练,构建杀伤有效性预测模型,并进行验证评估;
[0017]步骤6、对特征拼接模型进行训练,构建EC50预测模型,并进行验证评估;
[0018]步骤7、利用构建的杀伤有效性预测模型和EC50预测模型进行杀伤有效性和EC50值的预测。
[0019]作为进一步的技术特征,步骤1中,所述不同来源的肿瘤类器官包括由脱敏处理后临床样本原代提取的肿瘤类器官、从其他样本库获得的类器官、从干细胞诱导分化的特定类型的肿瘤类器官、细胞系构建的类器官中的一种或多种;
[0020]作为进一步的技术特征,所述湿实验数据结果包括组学检测数据结果、活性检测数据结果、图像数据结果中的一种或几种;其中,图像数据又包括带时间信息的明场三维成像数据和/或带时间信息的荧光染色图像数据。
[0021]作为进一步的技术特征,进行湿实验时,化合物基准浓度由器官芯片样本数据库中的药物浓度信息换算得到;
[0022]作为进一步的技术特征,若进行湿实验的化合物为已上市的药物,在器官芯片数据库中能够获得常规剂量下的血药峰度数据(Cmax),则以此浓度作为器官芯片培养时,随培养液加入的化合物基准浓度;常规剂量下的血药峰度数据(Cmax),即以标准剂量服用药物后,在药物作用时间周期上血浆内于血浆蛋白结合或有利于血浆中的化合物可以达到的最大药物浓度。
[0023]若进行湿实验的化合物无法从器官芯片数据库中获得常规剂量下的血药峰度数据(Cmax),该化合物的加药基准浓度需要基于其处方建议的常规用药浓度进行换算得到;
[0024]作为进一步的技术特征,步骤3中,文本型数据包括器官芯片数据库中信息数据和
湿实验数据库中的湿实验基础信息;数值型数据包括湿实验数据结果信息中的组学检测数据结果、活性检测数据结果中的一种或几种;图像型数据包括湿实验数据结果信息中的图像数据结果。
[0025]作为进一步的技术特征,文本型数据的预处理、特征提取及向量化,具体包括:首先对文本形式的信息中存在的明显异常输入、缺失等不合理值进行手动预处理;然后使用自然语言工具对文本中的语气词、标点符号、不规范用词进行清洗;接着使用scikit

learn进行特征提取,将样本库中文本信息的特征结构化,并通过One

Hot编码处理离散的特征,和通过Word2Vec处理常规频次文本型特征,将文本数据转化为模型可以处理的数值型向量。
[0026]作为进一步的技术特征,数值型数据结果的预处理、特征提取及向量化,包括:首先采用StandardScaler库中的z_score_scaler.fit_transform()函数的Z
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,包括:步骤1、构建器官芯片样本库所述器官芯片样本库中存储有不同来源的肿瘤类器官的样本信息及其对应的临床信息;步骤2、构建湿实验数据库从器官芯片样本库中选择进行湿实验的器官芯片样本及其对应的至少一种化合物,器官芯片样本数据库中对应的化合物的信息确定湿实验过程中化合物的基准浓度,并基于该化合物基准浓度设立浓度梯度对器官芯片进行处理,获得湿实验数据结果,构建湿实验数据库;所述湿实验数据库中存储有湿实验信息,所述湿实验信息包括湿实验基础信息和湿实验数据结果;步骤3、 数据的预处理、特征提取及向量化:将器官芯片数据库中信息和湿实验数据库中的湿实验信息以文本、数值和图像进行区分归类,划分为文本型数据、数值型数据和图像型数据;然后分别对文本型数据、数值型数据和图像型数据进行预处理、特征提取及向量化,使之转化成计算机可识别的形式;步骤4、特征拼接模型的构建;使用特征拼接机制将文本型数据特征、数值型数据特征和图像型数据特征的进行组合,构建特征拼接模型;步骤5、对特征拼接模型进行训练,构建杀伤有效性预测模型,并进行验证评估;步骤6、对特征拼接模型进行训练,构建EC50预测模型,并进行验证评估;步骤7、利用构建的杀伤有效性预测模型和EC50预测模型进行杀伤有效性和EC50值的预测。2.根据权利要求1所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,步骤1中,所述不同来源的肿瘤类器官包括由脱敏处理后临床样本原代提取的肿瘤类器官、从其他样本库获得的肿瘤类器官、从干细胞诱导分化的特定类型的肿瘤类器官、细胞系构建的肿瘤类器官中的一种或多种;步骤2中,所述湿实验数据结果包括组学检测数据结果、活性检测数据结果、图像数据结果中的一种或几种;其中,图像数据又包括带时间信息的明场三维成像数据和/或带时间信息的荧光染色图像数据。3.根据权利要求1所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,步骤3中,文本型数据包括器官芯片数据库中信息数据和湿实验数据库中的湿实验基础信息;数值型数据包括湿实验数据结果信息中的组学检测数据结果、活性检测数据结果中的一种或几种;图像型数据包括湿实验数据结果信息中的图像数据结果。4.根据权利要求3所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,文本型数据的预处理、特征提取及向量化,具体包括:首先对文本形式的信息中存在的包括明显异常输入、缺失在内的不合理值进行手动预处理;然后使用自然语言工具对文本
中的语气词、标点符号、不规范用词进行清洗;接着使用scikit

learn进行特征提取,将文本信息特征结构化,并通过One

Hot编码处理离散的特征,和通过Word2Vec处理常规频次文本型特征,将文本数据转化为模型可以处理的数值型向量;数值型数据结果的预处理、特征提取及向量化,包括:首先采用StandardScaler库中的z_score_scaler.fit_transform()函数的Z

Score转换进行数据标准化,然后经归一化处理,将数值类特征进行向量化;其中部分特征数据进行范围化分类操作,并转化为等级分类标签;图像型数据结果的预处理、特征提取及向量化,包括:首先将图像型数据结果进行图像预处理,然后构建类器官影像预训练模型,并采用所构建的类器官影像预训练模型中解码器模块提取预处理后的图像数据中的图像特征数据并向量化。5.根据权利要求4所述的一种基于器官芯片和深度学习的抗肿瘤化合物预后药效的预测方法,其特征在于,图像型数据结果的图像预处理包括图像裁剪和圈选、图像尺寸调整、图像旋转翻转、图像暗角处理、图像色彩调整、标准化像素值中的一项或几项;图像型数据的特征提取及向量化:构建类器官影像预训练模型,并完成训练和验证后,采用类器官影像预训练模型中编码层的三维卷积神经网络的多层卷积和池化操作提取图像更低纬度的特征表征,实现特征提取及向量化,具体包括:步骤b

1、类器官影像预训练模型训练数据集构建以步骤3图像型数据预处理后的所有图像数据为初始训练集,将初始训练集中预处理后图像数据进行随机掩码,并在初始训练集中删除掩码对应子结构的像素向量数据,获得去除掩码部分子结构的剩余图像数据,然后将去除掩码部分子结构的剩余图像数据与掩码子结构像素向量数据构成训练数据集,用于对类器官影像预训练模型的训练;步骤b

2、类器官影像预训练模型的构建首先,将掩码处理完毕的三维空间向量图像,使用卷积核在三个维度上滑动进行的卷积运算,结合最大池化层筛选最大特征值作为输出,来逐层减小特征图的空间尺寸,保留主要特征,在解码层进行3D转置卷积,将空间尺寸放大恢复至池化处理前的原始尺寸;接着使用跳跃连接将池化前的数据与反卷积后的数据直接拼接,将低层次的特征信息传递到解码器中,以辅助恢复细节和位置信息,最终,通过最后一层卷积层输出与输入相同尺寸的图像结果,从而完成类器官影像预训练模型的设计;然后以随机掩码处理后的子结构信息补全为目标,以步骤b

1中的去除掩码部...

【专利技术属性】
技术研发人员:胡天牧于文龙顾忠泽
申请(专利权)人:江苏运动健康研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1