T细胞亚型鉴定的模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:38282323 阅读:8 留言:0更新日期:2023-07-27 10:30
本发明专利技术提供一种T细胞亚型鉴定的模型训练方法、装置、设备及存储介质,涉及生物技术领域,方法包括:获取预先设置的建立模型的数据集;基于建立模型的数据集的测序数据对应的Marker基因的表达量,从建立模型的数据集中提取T细胞的测序数据;在T细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定T细胞的测序数据与肿瘤特异性T细胞之间的第一对应关系;在T细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定T细胞的测序数据与非肿瘤特异性T细胞之间的第二对应关系;将第一对应关系和第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型。型鉴定模型。型鉴定模型。

【技术实现步骤摘要】
T细胞亚型鉴定的模型训练方法、装置、设备及存储介质


[0001]本专利技术涉及生物
,尤其涉及一种T细胞亚型鉴定的模型训练方法、装置、设备及存储介质。

技术介绍

[0002]肿瘤特异性T细胞是识别和杀伤肿瘤的主要淋巴细胞;此外,肿瘤特异性T细胞的T细胞(抗原)受体(T cell receptor,TCR)的鉴定,还可以提供患者治疗的临床监测生物标志物,用于跟踪抗肿瘤免疫反应的临床疗效,深入研究肿瘤免疫治疗的生物学机制。
[0003]目前,鉴定肿瘤特异性T细胞的常规方法是离体T细胞功能测试。
[0004]但是,上述鉴定过程对实验室平台的要求很高,鉴定周期长;并且,会漏掉很大一部分肿瘤特异性T细胞,例如可能遗漏内源性病毒抗原的T细胞或无法在体外激活的最终耗竭的T细胞等,肿瘤特异性T细胞的鉴定准确性低。

技术实现思路

[0005]本专利技术提供一种T细胞亚型鉴定的模型训练方法、装置、设备及存储介质,用以解决现有技术中肿瘤特异性T细胞的鉴定对实验室平台的要求很高、鉴定周期长及鉴定准确性低的问题。
[0006]本专利技术提供一种T细胞亚型鉴定的模型训练方法,包括:获取预先设置的建立模型的数据集;其中,所述建立模型的数据集至少包括肿瘤特异性T细胞的单细胞测序数据;基于所述建立模型的数据集的测序数据对应的标志Marker基因的表达量,从所述建立模型的数据集中提取T细胞的测序数据;在所述T细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与肿瘤特异性T细胞之间的第一对应关系;在所述T细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与非肿瘤特异性T细胞之间的第二对应关系;将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型。
[0007]根据本专利技术提供的一种T细胞亚型鉴定的模型训练方法,所述获取预先设置的建立模型的数据集,包括:获取预先设置的候选数据集;对所述候选数据集的测序数据执行过滤操作后,得到所述建立模型的数据集;其中,所述过滤操作包括以下步骤:从所述候选数据集中,去除基因的检出数量小于第一阈值的测序数据;从所述候选数据集中,去除特异性分子标签UMI的数量小于第二阈值的测序数据;从所述候选数据集中,去除UMI的线粒体基因表达量比例大于第三阈值的测序数
据;从所述候选数据集中,去除双细胞对应的测序数据。
[0008]根据本专利技术提供的一种T细胞亚型鉴定的模型训练方法,所述基于所述建立模型的数据集的测序数据对应的标志Marker基因的表达量,从所述建立模型的数据集中提取T细胞的测序数据,包括:基于所述建立模型的数据集的测序数据对应的Marker基因的表达量,从所述建立模型的数据集中提取第一候选测序数据;从所述第一候选测序数据的高变基因中,去除T细胞受体基因和组织解离诱导基因,得到所述T细胞的测序数据。
[0009]根据本专利技术提供的一种T细胞亚型鉴定的模型训练方法,所述从所述第一候选测序数据的高变基因中,去除T细胞受体基因和组织解离诱导基因,得到所述T细胞的测序数据,包括:从所述第一候选测序数据的高变基因中,去除所述T细胞受体基因和组织解离诱导基因,得到第二候选测序数据;通过预先设置的SCTransform算法处理所述第二候选测序数据,得到所述T细胞的测序数据。
[0010]根据本专利技术提供的一种T细胞亚型鉴定的模型训练方法,所述将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型,包括:通过极端梯度提升算法设定预先设置的第一候选模型的参数,得到初步鉴定模型;其中,所述参数包括以下至少一项:树的最大深度、学习率和采样百分比;将预先设置的逻辑回归模型作为分类模型;基于所述初步鉴定模型和所述分类模型,得到所述待训练模型。
[0011]根据本专利技术提供的一种T细胞亚型鉴定的模型训练方法,所述基于所述初步鉴定模型和所述分类模型,得到所述待训练模型,包括:基于所述初步鉴定模型和所述分类模型,得到第二候选模型;通过预先设置的10倍交叉验证算法,计算所述第二候选模型的目标超参数,基于所述目标超参数优化所述第二候选模型,得到所述待训练模型。
[0012]本专利技术还提供一种T细胞亚型鉴定的模型训练装置,包括:获取模块,用于获取预先设置的建立模型的数据集;其中,所述建立模型的数据集至少包括肿瘤特异性T细胞的单细胞测序数据;提取模块,用于基于所述建立模型的数据集的测序数据对应的标志Marker基因的表达量,从所述建立模型的数据集中提取T细胞的测序数据;确定模块,用于在所述T细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与肿瘤特异性T细胞之间的第一对应关系;在所述T细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与非肿瘤特异性T细胞之间的第二对应关系;训练模块,用于将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型。
[0013]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述T细胞亚型鉴定的模型训练方法。
[0014]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述T细胞亚型鉴定的模型训练方法。
[0015]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述T细胞亚型鉴定的模型训练方法。
[0016]本专利技术提供的T细胞亚型鉴定的模型训练方法、装置、设备及存储介质,相较于相关技术中通过离体T细胞功能测试来鉴定肿瘤特异性T细胞,存在对实验室平台的要求很高、鉴定周期长和鉴定准确性低的问题,通过本专利技术实施例训练得到的T细胞亚型鉴定模型鉴定肿瘤特异性T细胞,操作简单,分析效率高,有效降低了鉴定周期,并提高了肿瘤特异性T细胞的鉴定准确性。
附图说明
[0017]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术提供的T细胞亚型鉴定的模型训练方法的流程示意图之一;图2是本专利技术提供的T细胞亚型鉴定的模型训练方法的流程示意图之二;图3是本专利技术提供的T细胞亚型鉴定的模型训练方法中鉴定结果示例的示意图;图4是本专利技术提供的T细胞亚型鉴定的模型训练方法中肿瘤特异性T细胞和其他T细胞克隆分布比例柱形图;图5是本专利技术提供的T细胞亚型鉴定的模型训练方法中的受试者操作特征曲线图;图6是本专利技术提供的T细胞亚型鉴定的模型训练方法中的精准召回曲线图;图7是本专利技术提供的T细胞亚型鉴定的模型训练方法中的验证曲线图;图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种T细胞亚型鉴定的模型训练方法,其特征在于,包括:获取预先设置的建立模型的数据集;其中,所述建立模型的数据集至少包括肿瘤特异性T细胞的单细胞测序数据;基于所述建立模型的数据集的测序数据对应的标志Marker基因的表达量,从所述建立模型的数据集中提取T细胞的测序数据;在所述T细胞的测序数据对应的细胞支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与肿瘤特异性T细胞之间的第一对应关系;在所述T细胞的测序数据对应的细胞不支持识别肿瘤的注释信息的情况下,确定所述T细胞的测序数据与非肿瘤特异性T细胞之间的第二对应关系;将所述第一对应关系和所述第二对应关系作为训练数据,训练预先设置的待训练模型,得到T细胞亚型鉴定模型。2.根据权利要求1所述的T细胞亚型鉴定的模型训练方法,其特征在于,所述获取预先设置的建立模型的数据集,包括:获取预先设置的候选数据集;对所述候选数据集的测序数据执行过滤操作后,得到所述建立模型的数据集;其中,所述过滤操作包括以下步骤:从所述候选数据集中,去除基因的检出数量小于第一阈值的测序数据;从所述候选数据集中,去除特异性分子标签UMI的数量小于第二阈值的测序数据;从所述候选数据集中,去除UMI的线粒体基因表达量比例大于第三阈值的测序数据;从所述候选数据集中,去除双细胞对应的测序数据。3.根据权利要求1所述的T细胞亚型鉴定的模型训练方法,其特征在于,所述基于所述建立模型的数据集的测序数据对应的标志Marker基因的表达量,从所述建立模型的数据集中提取T细胞的测序数据,包括:基于所述建立模型的数据集的测序数据对应的Marker基因的表达量,从所述建立模型的数据集中提取第一候选测序数据;从所述第一候选测序数据的高变基因中,去除T细胞受体基因和组织解离诱导基因,得到所述T细胞的测序数据。4.根据权利要求3所述的T细胞亚型鉴定的模型训练方法,其特征在于,所述从所述第一候选测序数据的高变基因中,去除T细胞受体基因和组织解离诱导基因,得到所述T细胞的测序数据,包括:从所述第一候选测序数据的高变基因中,去除所述T细胞受体基因和组织解离诱导基因,得到第二候选测序数据;通过预先设置的SCTransfor...

【专利技术属性】
技术研发人员:史植文
申请(专利权)人:北京智因东方转化医学研究中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1