System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种sgRNA文库的分析方法和系统技术方案_技高网

一种sgRNA文库的分析方法和系统技术方案

技术编号:41328751 阅读:2 留言:0更新日期:2024-05-13 15:06
本申请提供了一种sgRNA文库的分析方法和系统,涉及生物信息技术领域,包括通过获取原始样本数据和原始sgRNA文库信息;对所述原始样本数据进行预处理,得到目标样本数据;比对所述目标样本数据与所述原始sgRNA文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;基于所述匹配信息,对所述原始sgRNA文库信息进行分析,得到分析结果,确定目标基因,提高sgRNA文库的分析准确性,减少人力物力成本。

【技术实现步骤摘要】

本专利技术涉及生物信息,尤其涉及一种sgrna文库的分析方法和系统。


技术介绍

1、在crispr/cas9基因敲除文库中,向导rna(sgrna)是引导cas9酶进行精准切割的重要元件。每个sgrna都包含一个靶向序列,用于识别和结合到特定dna序列上,从而引导cas9酶进行切割。

2、在crispr/cas9的基因敲除文库可靶向编辑全基因组范围的目的基因时,利用生物信息学手段统计sgrna文库的丰度,从而鉴定出与特定表型相关的基因。其中,sgrna文库丰度统计的准确性尤为重要。

3、目前的sgrna文库的丰度分析方法主要是通过将测序序列与sgrna文库比对的方法来统计与sgnra文库中完全匹配的sgrna数目及丢失的sgrna等,即使有些算法会切除fastq文件中的一致性序列,但仍然可能有一些测序序列与sgrna文库中的某些条目存在一定的相似性,导致它们被错误地匹配,降低了sgrna文库分析的准确率。

4、因此,需提出一种sgrna文库的分析方法和系统。


技术实现思路

1、本说明书提供一种sgrna文库的分析方法和系统,通过比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因,提高sgrna文库的分析准确性,减少人力物力成本。

2、本申请提供的一种sgrna文库的分析方法采用如下的技术方案,包括

3、获取原始样本数据和原始sgrna文库信息;

4、对所述原始样本数据进行预处理,得到目标样本数据;

5、比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;

6、基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因。

7、可选的,所述获取原始样本数据,包括:

8、获取原始配置信息;

9、根据所述原始配置信息中的样本脚本,确定所述原始样本数据的位置并提取所述原始样本数据,所述原始样本数据包括第一测序数据和第二测序数据。

10、可选的,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:

11、依照预设处理条件对所述第一测序数据进行质控和过滤,得到第一目标数据;

12、依照所述预设处理条件对所述第二测序数据进行质控和过滤,得到第二目标数据;

13、将所述第一目标数据和所述第二目标数据进行合并,得到所述目标样本数据。

14、可选的,所述比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,包括:

15、校验所述目标样本数据,基于校验结果确定所述目标样本数据中的第一统计信息;

16、基于所述第一统计信息和所述原始sgrna文库信息,得到匹配信息。

17、可选的,所述基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因,包括:

18、基于所述匹配信息进行差异分析,得到差异分析结果;

19、根据所述差异分析结果,按照预设筛选顺序筛选目标基因;分析得到所述目标基因的可视化结果和富集分析结果。

20、可选的,所述基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,包括:

21、对所述匹配信息进行标准化,基于标准化结果绘制箱线图,得到分布结果。

22、可选的,还包括:

23、所述目标样本数据包括处理样本;

24、对所述处理样本进行主成分分析和样本相关性聚类分析,得到相关性分析结果。

25、可选的,还包括:

26、汇总所述分布结果、所述差异分析结果、所述目标基因的可视化结果和富集分析结果中的至少一个,生成分析报告。

27、本申请提供的一种sgrna文库的分析系统采用如下的技术方案,包括:

28、获取模块,用于获取原始样本数据和原始sgrna文库信息;

29、预处理模块,用于对所述原始样本数据进行预处理,得到目标样本数据;

30、比对模块,用于比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,所述匹配信息包括完全匹配信息、部分匹配信息;

31、分析模块,用于基于所述匹配信息,对所述原始sgrna文库信息进行分析,得到分析结果,确定目标基因。

32、可选的,所述获取模块,包括:

33、第一获取子模块,用于获取原始配置信息;

34、第二获取子模块,用于根据所述原始配置信息中的样本脚本,确定所述原始样本数据的位置并提取所述原始样本数据,所述原始样本数据包括第一测序数据和第二测序数据。

35、可选的,所述预处理模块,包括:

36、第一预处理子模块,用于依照预设处理条件对所述第一测序数据进行质控和过滤,得到第一目标数据;

37、第二预处理子模块,用于依照所述预设处理条件对所述第二测序数据进行质控和过滤,得到第二目标数据;

38、合并子模块,用于将所述第一目标数据和所述第二目标数据进行合并,得到所述目标样本数据。

39、可选的,所述比对模块,包括:

40、校验子模块,用于校验所述目标样本数据,基于校验结果确定所述目标样本数据中的第一统计信息;

41、匹配子模块,用于基于所述第一统计信息和所述原始sgrna文库信息,得到匹配信息。

42、可选的,所述分析模块,包括:

43、差异分析子模块,用于基于所述匹配信息进行差异分析,得到差异分析结果;

44、第二分析子模块,用于根据所述差异分析结果,按照预设筛选顺序筛选目标基因;分析得到所述目标基因的可视化结果和富集分析结果。

45、可选的,所述分析模块,包括:

46、分布分析子模块,用于对所述匹配信息进行标准化,基于标准化结果绘制箱线图,得到分布结果。

47、可选的,还包括:

48、所述目标样本数据包括处理样本;

49、聚类分析子模块,用于对所述处理样本进行主成分分析和样本相关性聚类分析,得到相关性分析结果。

50、可选的,还包括:

51、报告生成子模块,用于汇总所述分布结果、所述差异分析结果、所述目标基因的可视化结果和富集分析结果中的至少一个,生成分析报告。

52、本说明书还提供一种电子设备,其中,该电子设备包括:

53、处理器;以及,

54、存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一项方法。

55、本说明书还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序本文档来自技高网...

【技术保护点】

1.一种sgRNA文库的分析方法,其特征在于,包括:

2.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述获取原始样本数据,包括:

3.如权利要求2所述的一种sgRNA文库的分析方法,其特征在于,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:

4.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述比对所述目标样本数据与所述原始sgRNA文库信息,得到匹配信息,包括:

5.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述基于所述匹配信息,对所述原始sgRNA文库信息进行分析,得到分析结果,确定目标基因,包括:

6.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,所述基于所述匹配信息,对所述原始sgRNA文库信息进行分析,得到分析结果,包括:

7.如权利要求1所述的一种sgRNA文库的分析方法,其特征在于,还包括:

8.如权利要求5-7所述的一种sgRNA文库的分析方法,其特征在于,还包括:

9.一种sgRNA文库的分析系统,其特征在于,包括:

...

【技术特征摘要】

1.一种sgrna文库的分析方法,其特征在于,包括:

2.如权利要求1所述的一种sgrna文库的分析方法,其特征在于,所述获取原始样本数据,包括:

3.如权利要求2所述的一种sgrna文库的分析方法,其特征在于,所述对所述原始样本数据进行预处理,得到目标样本数据,包括:

4.如权利要求1所述的一种sgrna文库的分析方法,其特征在于,所述比对所述目标样本数据与所述原始sgrna文库信息,得到匹配信息,包括:

5.如权利要求1所述的一种sgrna文库的分析方法...

【专利技术属性】
技术研发人员:闫增强李鸿毅姜丽荣孙子奎
申请(专利权)人:上海派森诺生物科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1