【技术实现步骤摘要】
一种基于低深度测序估算植物基因组大小和/或重复度的方法
[0001]本专利技术属于植物分子生物
,具体涉及一种基于低深度测序估算植物基因组大小和
/
或重复度的方法
。
技术介绍
[0002]基因组包含物种最底层的遗传信息,植物的基因组比动物的基因组复杂,存在基因组大
、
多倍化
、
杂合度高
、
重复度高等特点
。
基因组大小(
Genome size
),即
C
值,是一个物种单倍体配子中所含有的
DNA
总量,一般以重量(
pg
)或核苷酸碱基对数目(
base pair
)表示,
1 pg DNA
约等于
978 Mb
的碱基对数目
。
陆地植物基因组大小的变化范围为
2400
倍,物基因组
C
值数据库(
https://cvalues.science.kew.org/
)记录有
1.2
万余个植物的基因组大小,开花植物中食肉螺旋狸藻(
Genlisea tuberosa
)的基因组仅有
61 Mb
,而日本重楼(
Paris japonica
)的基因组有
148Gb。
基因组大小是生物多样性和物种特异性的重要指征,各植物类群细胞中染色体数目和基因组大小相对固定 ...
【技术保护点】
【技术特征摘要】
1.
一种基于低深度测序估算植物基因组大小和
/
或重复度的方法,其特征在于,包括以下步骤:对未知基因组大小的植物进行低深度全基因组二代测序,得到低深度测序数据;所述低深度测序数据的大小为
3~5Gb
;所述低深度全基因二代测序的测序方式包括单端测序或双端测序;使用
BBDuk
软件对所述低深度测序数据进行质量过滤,得到干净的测序数据;所述质量过滤包括过滤掉低深度测序数据中的接头序列和污染序列;当所述低深度全基因组二代测序为双端测序时,在所述质量过滤后,还包括使用
BBMerge
软件对所述质量过滤后的测序数据进行合并,得到合并后的干净的测序数据;以所述干净的测序数据或者合并后的干净的测序数据为待处理数据,运行
RESPECT
软件对所述待处理数据设置5个抽样梯度(
100%、75%、50%、25%、1%
)进行预跑,得到第一轮迭代的结果;所述
RESPECT
软件内置了
Gurobi
;根据所述第一轮迭代的结果,得到第二轮迭代的起始种子全基因组测序深度;根据所述第二轮迭代的起始种子全基因组测序深度,在目标测序深度内设置梯度抽样,目标测序深度为
0.5
×
~5
×
,得到
11
个不同抽样梯度深度(
100%、90%、80%、70%、60%、50%、40%、30%、20%、10%、5%
)的抽样数据;使用
RESPECT
软件分别对所...
【专利技术属性】
技术研发人员:贺正山,杨俊波,曾春霞,李德铢,
申请(专利权)人:中国科学院昆明植物研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。