当前位置: 首页 > 专利查询>中国人民解放军军事科学院军事医学研究院专利>正文

基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法技术

技术编号：19425789 阅读：69 留言：0更新日期：2018-11-14 10:42

本发明专利技术公开了一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法，涉及基因测序技术领域。该模型构建方法通过将阳性样本训练集合P和阴性样本训练集合N作为机器学习输入，构建目标训练模型。通过该识别模型，可以对辐射损伤引起的嘧啶二聚体进行识别，该识别模型可用于Nanopore测序技术，对DNA序列发生变化例如TT二聚体进行预测。

全部详细技术资料下载

【技术实现步骤摘要】
基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法
本专利技术涉及基因测序
，具体而言，涉及一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法。
技术介绍
Nanopore测序技术，一种单分子实时测序的新一代测序方法，其以单分子DNA(RNA)通过生物纳米孔的电信号变化，由于不同的碱基带来的电信号变化是不同的，因此，应用通过机器学习得到的电信号识别模型可以推测其碱基组成，进而实现测序。紫外线可以造成DNA的损伤，将DNA分子中的胸腺嘧啶以环丁基环形成二聚体，称为胸腺嘧啶二聚体(TTdimer)。这种变化在DNA链上相邻近的胸苷酸容易发生。二聚形成后，RNA引物的合成将停止在二聚体处，DNA的合成也受阻。但目前来说，在Nanopore测序技术中使用的电信号识别模型针对的都是未经修饰的单分子DNA序列，缺乏针对经修饰(例如嘧啶二聚体、组蛋白修饰、甲基化修饰等)的DNA序列发生变化的电信号识别模型。因此，如果针对特定生物学问题如对于DNA辐射损伤中DNA序列改变的问题等展开分析研究，采用Nanopore测序技术进行测序的容易导致测序结果不准确。鉴于此，特提出本专利技术。
技术实现思路
本专利技术的目的在于提供一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法，通过该构建方法，可以得到针对辐射损伤中嘧啶二聚体的识别模型，该识别模型可用于DNA损伤例如TT二聚体进行预测。本专利技术是这样实现的：一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法，其包括如下步骤：步骤(1)：提供目标测序序列...

【技术保护点】
1.一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法，其特征在于，其包括如下步骤：步骤(1)：提供目标测序序列及其对应的目标测序序列电信号，所述目标测序序列由Nanopore测序技术对UV照射后的酵母细胞进行测序得到；步骤(2)：将所述目标测序序列与参考序列比对，获得比对准确的具有连续两个TT以上的位点的连续TT集合S，其中，所述参考序列为酵母基因组序列；步骤(3)：以所述连续TT集合S与预先设置的TT二聚体集合B的交集作为机器学习的阳性样本训练集合P，以所述连续TT集合S与所述预先设置的TT二聚体集合B的的差集作为机器学习的阴性样本训练集合N；步骤(4)：分别将阳性样本训练集合P和阴性样本训练集合N中的连续TT位点向其上下游各拓展4bp，得到覆盖TT二聚体位点的10bp碱基序列，根据步骤(1)中的所述目标测序序列电信号获取每个10bp碱基序列相对应的电信号特征；以得到与所述阳性样本集合P对应的阳性样本碱基序列集和阳性样本电信号特征集，以及与所述阴性样本集合N对应的阴性样本碱基序列集和阴性样本电信号特征集；步骤(5)：将步骤(4)的阳性样本训练集合P和阴性样本训练...

【技术特征摘要】
1.一种基于Nanopore测序技术识别辐射损伤中嘧啶二聚体的模型构建方法，其特征在于，其包括如下步骤：步骤(1)：提供目标测序序列及其对应的目标测序序列电信号，所述目标测序序列由Nanopore测序技术对UV照射后的酵母细胞进行测序得到；步骤(2)：将所述目标测序序列与参考序列比对，获得比对准确的具有连续两个TT以上的位点的连续TT集合S，其中，所述参考序列为酵母基因组序列；步骤(3)：以所述连续TT集合S与预先设置的TT二聚体集合B的交集作为机器学习的阳性样本训练集合P，以所述连续TT集合S与所述预先设置的TT二聚体集合B的的差集作为机器学习的阴性样本训练集合N；步骤(4)：分别将阳性样本训练集合P和阴性样本训练集合N中的连续TT位点向其上下游各拓展4bp，得到覆盖TT二聚体位点的10bp碱基序列，根据步骤(1)中的所述目标测序序列电信号获取每个10bp碱基序列相对应的电信号特征；以得到与所述阳性样本集合P对应的阳性样本碱基序列集和阳性样本电信号特征集，以及与所述阴性样本集合N对应的阴性样本碱基序列集和阴性样本电信号特征集；步骤(5)：将步骤(4)...

【专利技术属性】
技术研发人员：李昊，陈河兵，洪浩，张卓，黄昕，江帅，李睿江，李宛莹，伯晓晨，
申请(专利权)人：中国人民解放军军事科学院军事医学研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人