一种用于B细胞抗原表位预测的数据集构建方法技术

技术编号:45045920 阅读:29 留言:0更新日期:2025-04-22 17:32
一种用于B细胞抗原表位预测的数据集构建方法,所述发明专利技术是利用河北省自然科学基金做出的一项发明专利技术,基金的项目名称为“基于自学习机制的B细胞抗原表位预测研究。本发明专利技术包括以下步骤:a.建立表位样本集合、非表位样本集合和候选序列集合;b.从表位样本集合和非表位样本集合中抽取正样本种子集合和负样本种子集合;c.利用候选序列集合对基于深度Q_learning算法进行训练,同时对Q网络进行优化,得到非表位自动化筛选器;d.选出非表位序列与IEDB数据库中的序列一起作为样本数据集合,选择同样数量的表位和非表位序列,组成数据集。本发明专利技术在蛋白质序列片段数据中学习非表位数据,可获取高质量的样本数据集,提高抗原表位分类的准确性。

【技术实现步骤摘要】

本专利技术涉及一种用于b细胞抗原表位预测的数据集构建方法,属于数据处理。


技术介绍

1、本专利技术是利用河北省自然科学基金做出的一项专利技术,基金的项目名称为“基于自学习机制的b细胞抗原表位预测研究,项目编号为:f2022302001”。

2、基于机器学习的b细胞抗原表位预测在疫苗研发、疾病试剂盒开发中具有重要的应用,它可以快速识别抗原表位,加快研发进度,节省研发投入。

3、基于机器学习预测b细胞抗原表位多采用监督学习方式,也就是在数据集上做分类。分类模型训练必须以高质量的样本数据集作为基础。公开号为cn114242169a的中国专利技术专利公开了一种用于b细胞的抗原表位预测方法,所述方法首先组成预训练集合pt;在q_learning算法的每一个episode中,q代理以蛋白质一级序列中任意8个连续的氨基酸残基为状态,以从每个状态后面的12个连续残基中选择k个残基并入该状态作为第一个动作;以选择n个互补的分类器之一作为第二动作选项,按照连续动作搜索法在pt中进行搜索,对搜索出的氨基酸序列由倾向性奖励法则给出即时奖励,计算q值并更新,本文档来自技高网...

【技术保护点】

1.一种用于B细胞抗原表位预测的数据集构建方法,其特征是,所述方法包括以下步骤:

2.根据权利要求1所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,所述建立表位样本集合EPTL、非表位样本集合NEPTL和候选序列集合CPTL的具体方法如下:

3.根据权利要求2所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,建立表位样本集合EPTL、非表位样本集合NEPTL和候选序列集合CPTL时,序列长度L为:7<L<25。

4.根据权利要求1所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,对基于深度Q_learning...

【技术特征摘要】

1.一种用于b细胞抗原表位预测的数据集构建方法,其特征是,所述方法包括以下步骤:

2.根据权利要求1所述的一种用于b细胞抗原表位预测的数据集构建方法,其特征是,所述建立表位样本集合eptl、非表位样本集合neptl和候选序列集合cptl的具体方法如下:

3.根据权利要求2所述的一种用于b细胞抗原表位预测的数据集构建方法,其特征是,建立表位样本集合eptl、非表位样本集合neptl和候选序列集合cptl时,序列长度l为:7<l<25。

【专利技术属性】
技术研发人员:羊红光白双艳成彬
申请(专利权)人:河北省科学院应用数学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1