System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息,尤其涉及一种sgrna文库的分析方法和系统。
技术介绍
1、在crispr/cas9基因敲除文库中,向导rna(sgrna)是引导cas9酶进行精准切割的重要元件。每个sgrna都包含一个靶向序列,用于识别和结合到特定dna序列上,从而引导cas9酶进行切割。
2、在crispr/cas9的基因敲除文库可靶向编辑全基因组范围的目的基因时,利用生物信息学手段统计sgrna文库的丰度,从而鉴定出与特定表型相关的基因。其中,sgrna文库丰度统计的准确性尤为重要。
3、目前的sgrna文库的丰度分析方法主要是通过将测序序列与sgrna文库比对的方法来统计与sgnra文库中完全匹配的sgrna数目及丢失的sgrna等,即使有些算法会切除fastq文件中的一致性序列,但仍然可能有一些测序序列与sgrna文库中的某些条目存在一定的相似性,导致它们被错误地匹配,降低了sgrna文库分析的准确率。
4、因此,需提出一种sgrna文库的分析方法和系统。
技术实现思路
1、本说明书提供一种sgrna文库的分析方法和系统,通过比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因,提高sgrna文库的分析准确性,减少人力物力成本。
2、本申请提供的一种sgrna文库的分析方法采用如下的技术方案,包括
3、获取原始样本数据和原始sgrna文库信息;
4、对所述原始样本数据进行预处理,得到目标样本数据;
5、比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;
6、基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因。
7、可选的,所述获取原始样本数据,包括:
8、获取原始配置信息;
9、根据所述原始配置信息中的样本脚本,确定所述原始样本数据的位置并提取所述原始样本数据,所述原始样本数据包括第一测序数据和第二测序数据。
10、可选的,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:
11、依照预设处理条件对所述第一测序数据进行质控和过滤,得到第一目标数据;
12、依照所述预设处理条件对所述第二测序数据进行质控和过滤,得到第二目标数据;
13、将所述第一目标数据和所述第二目标数据进行合并,得到所述目标样本数据。
14、可选的,所述比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,包括:
15、校验所述目标样本数据,基于校验结果确定所述目标样本数据中的第一统计信息;
16、基于所述第一统计信息和所述原始sgrna文库信息,得到匹配信息。
17、可选的,所述基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因,包括:
18、基于所述匹配信息进行差异分析,得到差异分析结果;
19、根据所述差异分析结果,按照预设筛选顺序筛选目标基因;分析得到所述目标基因的可视化结果和富集分析结果。
20、可选的,所述基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,包括:
21、对所述匹配信息进行标准化,基于标准化结果绘制箱线图,得到分布结果。
22、可选的,还包括:
23、所述目标样本数据包括处理样本;
24、对所述处理样本进行主成分分析和样本相关性聚类分析,得到相关性分析结果。
25、可选的,还包括:
26、汇总所述分布结果、所述差异分析结果、所述目标基因的可视化结果和富集分析结果中的至少一个,生成分析报告。
27、本申请提供的一种sgrna文库的分析系统采用如下的技术方案,包括:
28、获取模块,用于获取原始样本数据和原始sgrna文库信息;
29、预处理模块,用于对所述原始样本数据进行预处理,得到目标样本数据;
30、比对模块,用于比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;
31、分析模块,用于基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因。
32、可选的,所述获取模块,包括:
33、第一获取子模块,用于获取原始配置信息;
34、第二获取子模块,用于根据所述原始配置信息中的样本脚本,确定所述原始样本数据的位置并提取所述原始样本数据,所述原始样本数据包括第一测序数据和第二测序数据。
35、可选的,所述预处理模块,包括:
36、第一预处理子模块,用于依照预设处理条件对所述第一测序数据进行质控和过滤,得到第一目标数据;
37、第二预处理子模块,用于依照所述预设处理条件对所述第二测序数据进行质控和过滤,得到第二目标数据;
38、合并子模块,用于将所述第一目标数据和所述第二目标数据进行合并,得到所述目标样本数据。
39、可选的,所述比对模块,包括:
40、校验子模块,用于校验所述目标样本数据,基于校验结果确定所述目标样本数据中的第一统计信息;
41、匹配子模块,用于基于所述第一统计信息和所述原始sgrna文库信息,得到匹配信息。
42、可选的,所述分析模块,包括:
43、差异分析子模块,用于基于所述匹配信息进行差异分析,得到差异分析结果;
44、第二分析子模块,用于根据所述差异分析结果,按照预设筛选顺序筛选目标基因;分析得到所述目标基因的可视化结果和富集分析结果。
45、可选的,所述分析模块,包括:
46、分布分析子模块,用于对所述匹配信息进行标准化,基于标准化结果绘制箱线图,得到分布结果。
47、可选的,还包括:
48、所述目标样本数据包括处理样本;
49、聚类分析子模块,用于对所述处理样本进行主成分分析和样本相关性聚类分析,得到相关性分析结果。
50、可选的,还包括:
51、报告生成子模块,用于汇总所述分布结果、所述差异分析结果、所述目标基因的可视化结果和富集分析结果中的至少一个,生成分析报告。
52、本说明书还提供一种电子设备,其中,该电子设备包括:
53、处理器;以及,
54、存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一项方法。
55、本说明书还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序本文档来自技高网...
【技术保护点】
1.一种sgRNA文库的分析方法,其特征在于,包括:
2.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述获取原始样本数据,包括:
3.如权利要求2所述的一种sgRNA文库的分析方法,其特征在于,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:
4.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述比对所述目标样本数据与所述原始sgRNA文库信息,得到匹配信息,包括:
5.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述基于所述匹配信息,对所述原始sgRNA文库信息进行分析,得到分析结果,确定目标基因,包括:
6.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述基于所述匹配信息,对所述原始sgRNA文库信息进行分析,得到分析结果,包括:
7.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,还包括:
8.如权利要求5-7所述的一种sgRNA文库的分析方法,其特征在于,还包括:
9.一种sgRNA文库的分析
...【技术特征摘要】
1.一种sgrna文库的分析方法,其特征在于,包括:
2.如权利要求1所述的一种sgrna文库的分析方法,其特征在于,所述获取原始样本数据,包括:
3.如权利要求2所述的一种sgrna文库的分析方法,其特征在于,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:
4.如权利要求1所述的一种sgrna文库的分析方法,其特征在于,所述比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,包括:
5.如权利要求1所述的一种sgrna文库的分析方法...
【专利技术属性】
技术研发人员:闫增强,李鸿毅,姜丽荣,孙子奎,
申请(专利权)人:上海派森诺生物科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。