System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于小鼠体内mRNA疫苗免疫应答生信分析系统及其使用方法技术方案_技高网

基于小鼠体内mRNA疫苗免疫应答生信分析系统及其使用方法技术方案

技术编号:41229972 阅读:4 留言:0更新日期:2024-05-09 23:46
本发明专利技术公开了一种小鼠体内mRNA疫苗免疫应答生信分析系统,包括,包括模块数据收集与预处理模块、模块细胞类型自动注释模块、时序数据免疫响应分析模块和实验数据检验结果模块。本发明专利技术研究小鼠体内mRNA疫苗的免疫应答方便、快捷,实现了对数据的自动化分析,集成数据收集与预处理、细胞类型自动注释、基因富集分析和实验数据验证功能,为研究人员减少免疫响应分析的工作量,提高分析效率和分析的准确度。

【技术实现步骤摘要】

本专利技术涉及生物信息学领域,特别是涉及一种基于小鼠体内mrna疫苗免疫应答生信分析系统及其使用方法。


技术介绍

1、mrna疫苗是核酸疫苗的一种,它的机制是通过将编码抗原蛋白的mrna接种到宿主,然后在体内细胞中利用宿主的遗传物质进行表达合成抗原蛋白,通过抗原蛋白诱导和激活机体的免疫系统产生免疫反应,从而达到预防和治疗疾病的目的。作为第三代疫苗,mrna相比于传统的疫苗有其独特的优势,可以轻松实现对所有生产过程的监测和质控,节省了细胞培养、抗原提取和纯化等过程,大大缩短了生产时间,能够很容易实现量产,提高了疫苗的产能,这对于快速应对全球范围的新发传染病至关重要。除此之外,mrna疫苗的研发和生产周期短,前期合成比较快,一旦临床数据验证其有效性和安全后,能够在短期内向下游推进疫苗的生产。mrna由于其自身的特性,免疫后在转染细胞的细胞质中能够很快地降解,降低其安全性的风险,而且不存在dna疫苗整合到宿主染色质中的风险。

2、mrna的研发流程包括抗原选择、mrna序列设计、mrna合成、纳米颗粒包裹、临床前研究和临床试验6个步骤,涉及生物、化学、计算机等多个领域。其中临床前研究是mrna疫苗研发过程中的一个重要阶段,目的是有效的评估疫苗的有效性和安全性,了解疫苗的免疫响应机制。对mrna疫苗的每一次修改都需要重新进行效果和安全性评估,所以临床前研究是一个需要做大量重复性实验的步骤。尽管我们对mrna疫苗的免疫反应有很多新的了解,但在其作用机制方面仍存在重大知识空白。目前常见的研究免疫应答的技术有高通量单细胞测序、冷冻电镜、病毒中和实验等,其中单细胞测序数据分析是一个重要的研究途径,可以深入了解疫苗诱导的免疫应答,例如chunfeng li等人通过分析二次注射bnt162b2疫苗的单细胞数据发现二次免疫诱导了比初次接种后高得多的先天免疫反应。

3、单细胞测序数据分析通常是使用r语言的seurat软件包或python语言的scanpy软件包对多次注射疫苗的小鼠单细胞转录组时序数据进行手动分析。首先,通过质量控制对单细胞数据进行筛选,获取高质量转录组数据。然后,识别数据的特异性基因,进行主成分分析(pca),使用统一流形逼近和投影(umap)和基于图的聚类算法leiden的降维进行细胞簇划分,通过wilcoxon秩和检验等方法检索每个簇的标记基因,根据收集的细胞类型marker基因进行细胞类型鉴定。最后,提取差异表达基因,使用血液转录模块btms(bloodtranscription modules)或gsea中的数据库进行基因富集分析。

4、这种传统的手动分析方法存在耗时长、重复性工作多、操作复杂和具有较强主观性的问题。在手动分析鉴定细胞类型时存在过分依赖marker基因、操作复杂、重复性工作多的问题。marker基因的来源是cellmarker等数据库或相关文献,存在部分细胞类型的marker基因缺失的情况,大多数细胞类型是由一组marker基因而不是单个marker基因决定,如果没有适当的方法来整合多个marker基因,就很难保证每个簇的统一和准确的细胞类型分配,因此选择marker基因需要基于研究人员的先验知识。其次,主成分分析和降维聚类划分细胞群时需要反复调试参数,不同的参数会导致不同的细胞聚类结果,所以参数选择受人为主观因素影响较大。为了解决手动注释细胞类型存在的过分依赖marker基因、注释操作繁琐、效率低下等问题,近年来出现了许多细胞类型自动注释方法,目前已有的细胞类型自动注释算法主要分为三类,基于marker基因的方法例如sccatch、scsa、scina等,是通过整合多个来源的marker基因,计算细胞簇的标记基因并进行评分实现自动注释,这种方法虽然解决了手动注释操作繁琐、效率低下的问题,但存在过分依赖marker基因数据库的问题。基于相关性计算的方法例如singler、scmap、clustifyr等,是通过测量待注释数据集和参考数据集之间基因表达谱的相关性进行自动注释,这种方法受到跨平台和实验的批次效应的影响很大,且无法保存重要的样本多样性。基于机器学习或深度学习的方法例如scpred、scbert、ciform等,相比于其他方法具有更高的准确率,也不依赖marker基因数据库,但训练模型需要准备大规模的训练数据集,收集数据集、数据预处理和数据标签添加造成了巨大的工作量,训练模型需要很长的时间,对计算资源和研究人员的代码能力要求较高,且使用的数据集在广度和规模上往往是有限的。除此之外,上述方法大部分是基于r语言实现的,相比r语言,python语言可以更好的发挥人工智能的优势。

5、在基因富集分析模块存在工作量大、内容重复性过高、耗时较长、无法自动筛选结果的问题,针对不同条件下、不同时间点、不同细胞类型的数据需要在两两之间进行差异基因分析,对每一个差异基因的结果都需要进行富集分析,且需要从大量富集结果中人为挑选与免疫相关的富集结果进行可视化,除此之外,常见的手动分析流程中缺乏专门的时序分析,没有关注到免疫细胞的时序变化趋势。

6、名词解释:whole-human(recommended)模型:全人类(推荐)模型,指在3300万正常人体细胞进行预训练的模型参数,来自文献《cui,h.,wang,c.,maan,h.,pang,k.,luo,f.,&wang,b.(2023).scgpt:towards building a foundation model for single-cellmulti-omics using generative ai.biorxiv[preprint],april 30,2023.https://doi.org/10.1101/2023.04.30.538439》

7、adata.obs[‘day’]:adata是以anndata数据存储格式存在的单细胞转录组测序数据。adata.obs是adata数据中存储观察值数据的部分,包含了细胞的注释信息,数据类型是pandas dataframe。anndata的定义来自参考文献《virshup,i.,bredikhin,d.,heumos,l.etal.the scverse project provides a computational ecosystem for single-cellomics data analysis.nat biotechnol 41,604–606(2023).https://doi.org/10.1038/s41587-023-01733-8》

8、plot_cell_type_trend函数:本研究设计的绘图函数之一,用于统计每种细胞类型的细胞数量,绘制细胞数量随时间变化的折线图和每个时间点的数据中每种细胞的百分比堆叠柱状图。

9、函数plot_diff_genes_for_all_days(degs_data,results_path):本研究设计的绘图函数之一,用于统计每种细胞类型在不同时间点的上调差异基因、下调差异基因的数量本文档来自技高网...

【技术保护点】

1.一种小鼠体内mRNA疫苗免疫应答生信分析系统,其特征在于,包括模块数据收集与预处理模块、细胞类型自动注释模块、时序数据免疫响应分析模块和实验数据检验结果模块;

2.如权利要求1所述的小鼠体内mRNA疫苗免疫应答生信分析系统,其特征在于,所述细胞类型自动注释模型为scGPT单细胞多组学大模型。

3.一种小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,所述小鼠体内mRNA疫苗免疫应答生信分析系统如权利要求1所述;其中模块数据收集与预处理模块的使用方法如下:

4.如权利要求3所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,需要关注的免疫细胞类型包括先天免疫细胞Neutrophil、Macrophage、Dendriticcell、Natural Killer cells和后天免疫细胞B cell、T cell、Natural Killer T cell、Monocyte,从CellMarker2.0数据库和相关文献中收集每种细胞类型的marker基因。

5.如权利要求3所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,所述模块细胞类型自动注释模块的使用方法如下:

6.如权利要求5所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,所述预处理包括对齐免疫细胞数据集和实验数据集的基因,对数据进行批次信息添加、数据转换和标准化、测试集和训练集划分以及细胞类型编码;所述预训练参数为whole-human

7.如权利要求3所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,所述时序数据免疫响应分析模块的使用方法如下:

8.如权利要求7所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,

9.如权利要求7所述的小鼠体内mRNA疫苗免疫应答生信分析系统的使用方法,其特征在于,所述函数

...

【技术特征摘要】

1.一种小鼠体内mrna疫苗免疫应答生信分析系统,其特征在于,包括模块数据收集与预处理模块、细胞类型自动注释模块、时序数据免疫响应分析模块和实验数据检验结果模块;

2.如权利要求1所述的小鼠体内mrna疫苗免疫应答生信分析系统,其特征在于,所述细胞类型自动注释模型为scgpt单细胞多组学大模型。

3.一种小鼠体内mrna疫苗免疫应答生信分析系统的使用方法,其特征在于,所述小鼠体内mrna疫苗免疫应答生信分析系统如权利要求1所述;其中模块数据收集与预处理模块的使用方法如下:

4.如权利要求3所述的小鼠体内mrna疫苗免疫应答生信分析系统的使用方法,其特征在于,需要关注的免疫细胞类型包括先天免疫细胞neutrophil、macrophage、dendriticcell、natural killer cells和后天免疫细胞b cell、t cell、natural killer t cell、monocyt...

【专利技术属性】
技术研发人员:何敏周佳丽沙雏淋张鹏晖
申请(专利权)人:中国科学院基础医学与肿瘤研究所筹
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1