【技术实现步骤摘要】
基于生物云平台的甲基化数据分析应用系统
本专利技术涉及信息隐藏和数字图像处理领域,具体涉及一种基于生物云平台的甲基化数据分析应用系统。
技术介绍
随着高通量测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,生物大数据时代已经到来。DNA甲基化是表观遗传学的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。随着对甲基化研究的不断深入,各种各样甲基化检测方法被开发出来以满足不同类型研究的要求。基于重亚硫酸盐处理DNA片段后再进行高通量测序,已经成为DNA甲基化研究的重要方法。但是由于高通量测序产生出来的数据量十分巨大,需要使用生物信息学方法进行研究,并进一步分析得到有生物学意义的结果。使用传统的生物信息方法分析甲基化数据时,不仅仅要求配备高性能的超级计算集群和超大的硬盘空间,还需要求具备生物学知识、计算机知识和数学知识的复合型生物信息分析人员,整个分析过程涉及多个流程,效率不高。除此之外,目前已有的生物信息分析软件及数据库数量众多,难以高效整合这些数据和分析资源,也是现在制约科研工作的一个重要原因。
技术实现思路
有鉴于此,本专利技术提供一种基于生物云平台的甲基化数据分析应用系统,能够解决现有技术对甲基化测序数据处理过程中知识面需求过广,分析方法难以整合的技术问题,提高甲基化测序数据的分析效率。本专利技术实施例提出一种基于生物云平台的甲基化数据分析应用系统,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其 ...
【技术保护点】
一种基于生物云平台的甲基化数据分析应用系统,其特征在于,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块,用于对所述第二用户请求进行解析,根 ...
【技术特征摘要】
1.一种基于生物云平台的甲基化数据分析应用系统,其特征在于,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。2.根据权利要求1所述的系统,其特征在于,所述甲基化测序数据质量控制的过程为:识别所述待分析的甲基化测序数据的质量值的编码方式,并将不符合编码方式要求的数据的质量值转换为统一编码标准,基于转换后的质量值统计数据的碱基质量分布和碱基类型分布,并绘制分布图。3.根据权利要求2所述的系统,其特征在于,所述甲基化测序数据与所述参考基因组比对的过程为:将测序序列的胞嘧啶全部转化为胸腺嘧啶,命名为CT序列,将测序序列的鸟嘌呤转换为腺嘌呤,命名为GA序列,同时将参考基因组的胞嘧啶全部转化为胸腺嘧啶,命名为CT基因组,将参考基因组的鸟嘌呤转换为腺嘌呤,命名为GA基因组,将转换后的CT序列和转换后GA的序列分别和CT基因组、GA基因组进行比对,选取四次比对中最优的比对作为比对结果,最后根据比对结果统计比对效率、基因组覆盖情况以及插入片段的大小分布。4.根据权利要求3所述的系统,其特征在于,所述甲基化位点判定的过程为:基于所述甲基化测序数据与所述参考基因组比对的结果,将所述的最优比对序列和原始的测序序列进行比较,确定该测序序列的甲基化信息,使用二项分布检验,计算出胞嘧啶位点发生了甲基化的...
【专利技术属性】
技术研发人员:资意,
申请(专利权)人:北京百迈客生物科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。