基于scGPT的小分子跨模态生成方法技术

技术编号:39988400 阅读:32 留言:0更新日期:2024-01-09 02:04
一种基于scGPT的小分子跨模态生成方法,用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成SMILES与Mol格式输出。本发明专利技术通过输入所需的基因表达谱和对照基因表达谱,得到能够诱导所需转录组谱的候选分子。

【技术实现步骤摘要】

本专利技术涉及的是一种神经网络应用领域的技术,具体是一种基于单细胞基础模型(scgpt)的小分子跨模态生成方法。


技术介绍

1、基于表型的药物设计是生物信息学的重要研究内容,表型包含基因表达谱,细胞图等。现有的基于表型找药通过比较输入与收录的基因表达差异间的相似度,来寻找潜在的小分子药物,它受限数据库的大小与质量。


技术实现思路

1、本专利技术针对现有技术泛化能力差的问题进行优化,提出一种基于scgpt的小分子跨模态生成方法,通过输入所需的基因表达谱和对照基因表达谱,得到能够诱导所需转录组谱的候选分子。

2、本专利技术是通过以下技术方案实现的:

3、本专利技术涉及一种基于scgpt的小分子跨模态生成方法,用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成smiles与mol格式输本文档来自技高网...

【技术保护点】

1.一种基于scGPT的小分子跨模态生成方法,其特征在于,用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成SMILES与Mol格式输出。

2.根据权利要求1所述的基于scGPT的小分子跨模态生成方法,其特征是,所述的基因编码器采用开源的scGPT模型。

3.根据权利要求1所述的基于scGPT的小分子跨模态生成方法,其特征是,所述的分子编码器与生成器采用开源...

【技术特征摘要】

1.一种基于scgpt的小分子跨模态生成方法,其特征在于,用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成smiles与mol格式输出。

2.根据权利要求1所述的基于scgpt的小分子跨模态生成方法,其特征是,所述的基因编码器采用开源的scgpt模型。

3.根据权利要求1所述的基于scgpt的小分子跨模态生成方法,其特征是,所述的分子编码器与生成器采用开源的hiervae模型。

4.根据权利要求1所述的基于scgpt的小分子跨模态生成方法,其特征是,所述的预处理是指:选择l1000公共数据集(geo id:gse70138)中的level3中分属六大细胞系(vcap,p...

【专利技术属性】
技术研发人员:袁野张智科程佳贝
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1