一种用宏基因组测序数据肿瘤检测的分析系统及分析方法技术方案

技术编号:35457234 阅读:25 留言:0更新日期:2022-11-03 12:17
本发明专利技术涉及生物检测技术领域,具体涉及一种用宏基因组测序数据肿瘤检测的分析系统及分析方法,包括过滤子系统、预处理子系统和识别子系统,过滤子系统包括识别模块、定位模块和去除模块,识别模块识别宏基因组测序数据中的冗余序列,得到识别结果;定位模块对识别结果进行定位,得到定位信息;去除模块基于定位信息将宏基因组测序数据中的冗余序列去除,得到过滤序列;预处理子系统对过滤序列进行预处理,得到染色体波动情况;识别子系统将染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果,解决了现有的用宏基因组测序数据肿瘤检测的分析系统对肿瘤检测的精确度较低的问题。问题。问题。

【技术实现步骤摘要】
一种用宏基因组测序数据肿瘤检测的分析系统及分析方法


[0001]本专利技术涉及生物检测
,尤其涉及一种用宏基因组测序数据肿瘤检测的分析系统及分析方法。

技术介绍

[0002]随着宏基因组测序技术的发展及推广,临床在近年常用高通量测序技术对病人样本进行测序来寻找病原体,排查感染原因。除了感染因素以外,肿瘤往往也是一个重要原因。很多情况下,即使采用了CT、磁共振、PET等全身扫描技术,肿瘤排查也非常困难。很多患者进行了长时间的抗感染治疗,经过各种排查以后才发现是肿瘤患者,贻误了诊疗时间。
[0003]目前,现有技术公开了一种用宏基因组测序数据肿瘤检测的分析系统,通过从宏基因组测序数据中选择波动变异相关的指标或基于此的统计检验值来判断被检测样本是否来源于肿瘤样本。
[0004]采用上述方式,宏基因组测序数据中存在许多的冗杂序列片段,会降低对肿瘤检测的精确度。

技术实现思路

[0005]本专利技术的目的在于提供一种用宏基因组测序数据肿瘤检测的分析系统及分析方法,旨在解决现有的用宏基因组测序数据肿瘤检测的分析系统对肿瘤检测的精确度较低的问题。
[0006]为实现上述目的,第一方面,本专利技术提供了一种用宏基因组测序数据肿瘤检测的分析系统,包括过滤子系统、预处理子系统和识别子系统,所述过滤子系统、所述预处理子系统和所述识别子系统依次连接,所述过滤子系统包括识别模块、定位模块和去除模块,所述识别模块、所述定位模块和所述去除模块依次连接;
[0007]所述识别模块,用于识别宏基因组测序数据中的冗余序列,得到识别结果;
[0008]所述定位模块,用于对所述识别结果进行定位,得到定位信息;
[0009]所述去除模块,基于所述定位信息将所述宏基因组测序数据中的冗余序列去除,得到过滤序列;
[0010]所述预处理子系统,用于对所述过滤序列进行预处理,得到染色体波动情况;
[0011]所述识别子系统,用于将所述染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果。
[0012]其中,所述预处理子系统包括基因对比模块和分析模块,所述基因对比模块和所述分析模块连接;
[0013]所述基因对比模块,用于将所述过滤序列比对至人参考基因组上,得到对比基因组序列;
[0014]所述分析模块,用于对所述对比基因组序列进行波动分析,得到染色体波动情况。
[0015]其中,所述分析模块包括归一单元和波动计算单元,所述归一单元和所述波动计
算单元连接;
[0016]所述归一单元,用于对所述过滤序列进行归一化处理,得到归一序列;
[0017]所述波动计算单元,用于对所述归一序列进行波动分析,得到染色体波动情况。
[0018]其中,所述识别子系统包括构建模块、训练模块和检测模块,所述构建模块、所述训练模块和所述检测模块依次连接;
[0019]所述构建模块,用于构建神经网络模型;
[0020]所述训练模块,用于获取公开波动数据对所述神经网络模型进行训练,得到肿瘤识别模型;
[0021]所述检测模块,用于将所述染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果。
[0022]其中,所述训练模块包括获取单元、划分单元和训练单元,所述获取单元、所述划分单元和所述训练单元依次连接;
[0023]所述获取单元,用于获取公开波动数据,并对所述公开波动数据进行预处理,得到训练数据;
[0024]所述划分单元,用于将所述训练数据划分成训练集和验证集;
[0025]所述训练单元,用于分别使用所述训练集和所述验证集对所述神经网络模型进行训练和验证,得到肿瘤识别模型。
[0026]第二方面,本专利技术提供了一种用宏基因组测序数据肿瘤检测的分析方法,包括以下步骤:
[0027]通过识别模块识别宏基因组测序数据中的冗余序列,得到识别结果;
[0028]通过定位模块对所述识别结果进行定位,得到定位信息;
[0029]通过去除模块基于所述定位信息将所述宏基因组测序数据中的冗余序列去除,得到过滤序列;
[0030]通过预处理子系统对所述过滤序列进行预处理,得到染色体波动情况;
[0031]通过识别子系统将所述染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果。
[0032]本专利技术的一种用宏基因组测序数据肿瘤检测的分析系统及分析方法,通过所述识别模块识别宏基因组测序数据中的冗余序列,得到识别结果;所述定位模块对所述识别结果进行定位,得到定位信息;所述去除模块基于所述定位信息将所述宏基因组测序数据中的冗余序列去除,得到过滤序列;所述预处理子系统对所述过滤序列进行预处理,得到染色体波动情况;所述识别子系统将所述染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果,在进行肿瘤检测之前首先将所述宏基因组测序数据中的冗余序列去除,解决了现有的用宏基因组测序数据肿瘤检测的分析系统对肿瘤检测的精确度较低的问题。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是本专利技术提供的一种用宏基因组测序数据肿瘤检测的分析系统的结构示意图。
[0035]图2是定位模块的结构示意图。
[0036]图3是分析模块的结构示意图。
[0037]图4是训练模块和识别模块的结构示意图。
[0038]图5是本专利技术提供的一种用宏基因组测序数据肿瘤检测的分析方法的流程图。
[0039]1‑
过滤子系统、2

预处理子系统、3

识别子系统、4

识别模块、5

定位模块、6

去除模块、7

基因对比模块、8

分析模块、9

归一单元、10

波动计算单元、11

构建模块、12

训练模块、13

检测模块、14

获取单元、15

划分单元、16

训练单元、17

提取单元、18

调整单元、19

检测单元、20

分段单元、21

节点获取单元、22

记录模块。
具体实施方式
[0040]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用宏基因组测序数据肿瘤检测的分析系统,其特征在于,包括过滤子系统、预处理子系统和识别子系统,所述过滤子系统、所述预处理子系统和所述识别子系统依次连接,所述过滤子系统包括识别模块、定位模块和去除模块,所述识别模块、所述定位模块和所述去除模块依次连接;所述识别模块,用于识别宏基因组测序数据中的冗余序列,得到识别结果;所述定位模块,用于对所述识别结果进行定位,得到定位信息;所述去除模块,基于所述定位信息将所述宏基因组测序数据中的冗余序列去除,得到过滤序列;所述预处理子系统,用于对所述过滤序列进行预处理,得到染色体波动情况;所述识别子系统,用于将所述染色体波动情况输入肿瘤识别模型进行训练,得到肿瘤检测结果。2.如权利要求1所述的用宏基因组测序数据肿瘤检测的分析系统,其特征在于,所述预处理子系统包括基因对比模块和分析模块,所述基因对比模块和所述分析模块连接;所述基因对比模块,用于将所述过滤序列比对至人参考基因组上,得到对比基因组序列;所述分析模块,用于对所述对比基因组序列进行波动分析,得到染色体波动情况。3.如权利要求2所述的用宏基因组测序数据肿瘤检测的分析系统,其特征在于,所述分析模块包括归一单元和波动计算单元,所述归一单元和所述波动计算单元连接;所述归一单元,用于对所述过滤序列进行归一化处理,得到归一序列;所述波动计算单元,用于对所述归一序列进行波动分析,得到染色体波动情况。4.如权利要求3所述的用宏基因组测...

【专利技术属性】
技术研发人员:齐向云李建平何奕辉张爱国
申请(专利权)人:南京帝基生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1