当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于人类全转录本的微肽候选库及其应用制造技术

技术编号:37214384 阅读:18 留言:0更新日期:2023-04-20 23:03
本发明专利技术公开了一种基于人类全转录本的微肽候选库及其应用,基于人类全转录本的微肽候选库及其构建方法与应用,本发明专利技术提供一种高内涵的微肽候选库,利用人类细胞系、模式动物组织、临床样本作为实验材料,提取并纯化微肽,通过常规质谱检测荷质比,并与所述微肽候选库比对,完成对微肽这类非经典蛋白质的纯化与鉴定;该方法的分离材料易于得到,纯化鉴定得到的微肽精度高、遗漏率低,为微肽的应用研究奠定基础,解决现有方法不能高效从临床样本、组织或细胞中高通量检测微肽的问题。织或细胞中高通量检测微肽的问题。

【技术实现步骤摘要】
一种基于人类全转录本的微肽候选库及其应用
(一)

[0001]本专利技术涉及一种基于人类全转录本的微肽候选库及其应用。
(二)
技术介绍

[0002]蛋白质是生命的物质基础,是构成细胞的基本有机物,是生命活动的主要承担者,部分蛋白的异常表达和翻译与肿瘤发生密切相关。时至今日,人类基因组中已有近20000个基因被注释为蛋白质编码基因,其中约17000个蛋白质已得到生化实验水平上的验证。而其余98%的基因组中有数量巨大的一部分被转录为“非编码RNA”。正如其命名,长久以来,学界普遍认为这些RNA并不直接编码蛋白质,而是通过其他不同的方式调控细胞的生命活动。
[0003]但随着高通量技术的发展与生物信息学水平的进步,对于这些非编码RNA的认知也逐步更新,越来越多非编码RNA被发现具有编码长度较短的非经典蛋白质,即微肽的能力,这些基因序列被称为“短开放阅读框”(Short open reading frames,sORFs),这进一步说明这些非编码RNA所翻译出的微肽并非是个别的注释错误,而是蛋白质组水平的存在,意味着仍有一批数量巨大的蛋白质仍未被本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人类全转录本的微肽候选库,其特征在于,所述候选库按如下步骤构建:(1)下载人类/小鼠参考全基因组数据和基因注释文件,简称GTF文件;(2)筛选步骤(1)中以ATG、CTG、GTG或TTG中的一种为起始密码子,以TAG、TAA或TGA中的一种为终止密码子,满足三联密码子排布的开放阅读框序列作为待选微肽基因;(3)利用步骤(2)待选微肽基因所在基因组信息计算其在转录本上的相对位置,并将其RNA序列提取出来,计算微肽对应的RNA长度信息,筛选长度介于30

750之间的RNA序列;(4)将步骤(3)RNA序列信息转换成氨基酸序列信息,计算微肽对应的氨基酸长度信息,筛选长度为10到250个氨基酸之间的微肽,获得基于人类/小鼠全转录本的微肽候选库;将筛选的每个微肽的开放阅读框位置、RNA序列、RNA长度、氨基酸序列、氨基酸长度、转录本位置、转录本类型、基因位置、基因名、所属染色体、基因长度、起始密码子,微肽名以所属转录本+开放阅读框位置定义初步命名;按照fasta格式保存。2.如权利要求1所述基于人类全转录本的微肽候选库,其特征在于,步骤(1)人类参考全基因组数据源自http://ftp.ensembl.org/pub/release

103/fasta/homo_sapiens/dna/,GTF文件源自http://ftp.ensembl.org/pub/release

103/gtf/homo_sapiens/。3.如权利要求1所述基于人类全转录本的微肽候选库,其特征在于,步骤(2)利用Ribotricer v.1.3.2软件筛选。4.如权利要求1所述基于人类全转录本的微肽候选库,其特征在于,步骤(3)下载人类所有...

【专利技术属性】
技术研发人员:林爱福石成瑜王颖杨作臻桑凌杰
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1