【技术实现步骤摘要】
本专利技术涉及一种用于b细胞抗原表位预测的数据集构建方法,属于数据处理。
技术介绍
1、本专利技术是利用河北省自然科学基金做出的一项专利技术,基金的项目名称为“基于自学习机制的b细胞抗原表位预测研究,项目编号为:f2022302001”。
2、基于机器学习的b细胞抗原表位预测在疫苗研发、疾病试剂盒开发中具有重要的应用,它可以快速识别抗原表位,加快研发进度,节省研发投入。
3、基于机器学习预测b细胞抗原表位多采用监督学习方式,也就是在数据集上做分类。分类模型训练必须以高质量的样本数据集作为基础。公开号为cn114242169a的中国专利技术专利公开了一种用于b细胞的抗原表位预测方法,所述方法首先组成预训练集合pt;在q_learning算法的每一个episode中,q代理以蛋白质一级序列中任意8个连续的氨基酸残基为状态,以从每个状态后面的12个连续残基中选择k个残基并入该状态作为第一个动作;以选择n个互补的分类器之一作为第二动作选项,按照连续动作搜索法在pt中进行搜索,对搜索出的氨基酸序列由倾向性奖励法则给出即时奖
...【技术保护点】
1.一种用于B细胞抗原表位预测的数据集构建方法,其特征是,所述方法包括以下步骤:
2.根据权利要求1所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,所述建立表位样本集合EPTL、非表位样本集合NEPTL和候选序列集合CPTL的具体方法如下:
3.根据权利要求2所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,建立表位样本集合EPTL、非表位样本集合NEPTL和候选序列集合CPTL时,序列长度L为:7<L<25。
4.根据权利要求1所述的一种用于B细胞抗原表位预测的数据集构建方法,其特征是,对基于深度
...【技术特征摘要】
1.一种用于b细胞抗原表位预测的数据集构建方法,其特征是,所述方法包括以下步骤:
2.根据权利要求1所述的一种用于b细胞抗原表位预测的数据集构建方法,其特征是,所述建立表位样本集合eptl、非表位样本集合neptl和候选序列集合cptl的具体方法如下:
3.根据权利要求2所述的一种用于b细胞抗原表位预测的数据集构建方法,其特征是,建立表位样本集合eptl、非表位样本集合neptl和候选序列集合cptl时,序列长度l为:7<l<25。
【专利技术属性】
技术研发人员:羊红光,白双艳,成彬,
申请(专利权)人:河北省科学院应用数学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。