基于生物云平台的甲基化数据分析应用系统技术方案

技术编号:17008246 阅读:25 留言:0更新日期:2018-01-11 04:20
本发明专利技术公开一种基于生物云平台的甲基化数据分析应用系统,能够提高甲基化测序数据的分析效率。该系统包括:用户界面模块,用于获取并发送第一用户请求给基本分析模块;基本分析模块,用于对第一用户请求进行解析,从云端数据库获取待分析的甲基化测序数据和参考基因组,对甲基化测序数据进行初步分析,并将初步分析的结果发送给用户界面模块;用户界面模块,还用于对初步分析的结果进行展示,获取并发送第二用户请求给个性化分析模块;个性化分析模块,用于对第二用户请求进行解析,对待进行进一步分析的内容进行进一步分析,将进一步分析的结果发送给用户界面模块进行呈现。

【技术实现步骤摘要】
基于生物云平台的甲基化数据分析应用系统
本专利技术涉及信息隐藏和数字图像处理领域,具体涉及一种基于生物云平台的甲基化数据分析应用系统。
技术介绍
随着高通量测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,生物大数据时代已经到来。DNA甲基化是表观遗传学的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。随着对甲基化研究的不断深入,各种各样甲基化检测方法被开发出来以满足不同类型研究的要求。基于重亚硫酸盐处理DNA片段后再进行高通量测序,已经成为DNA甲基化研究的重要方法。但是由于高通量测序产生出来的数据量十分巨大,需要使用生物信息学方法进行研究,并进一步分析得到有生物学意义的结果。使用传统的生物信息方法分析甲基化数据时,不仅仅要求配备高性能的超级计算集群和超大的硬盘空间,还需要求具备生物学知识、计算机知识和数学知识的复合型生物信息分析人员,整个分析过程涉及多个流程,效率不高。除此之外,目前已有的生物信息分析软件及数据库数量众多,难以高效整合这些数据和分析资源,也是现在制约科研工作的一个重要原因。
技术实现思路
有鉴于此,本专利技术提供一种基于生物云平台的甲基化数据分析应用系统,能够解决现有技术对甲基化测序数据处理过程中知识面需求过广,分析方法难以整合的技术问题,提高甲基化测序数据的分析效率。本专利技术实施例提出一种基于生物云平台的甲基化数据分析应用系统,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。本专利技术实施例提供的基于生物云平台的甲基化数据分析应用系统,用户可以采用专业的生物信息分析方法对指定的甲基化测序数据进行分析,最终以图表呈现。整合多种分析方法,将数据分析做到具有个性化的特点,使得数据分析方式不再局限于传统生物信息分析的局限性,使普通用户也可实现对甲基化测序数据进行分析,并极大地丰富了对甲基化测序数据的解读性,提高对测序数据的处理效率,而且,用户指定的甲基化测序数据可以从云端数据库获取,从而能够节省本地磁盘空间。附图说明图1为本专利技术基于生物云平台的甲基化数据分析应用系统一实施例的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参看图1,本实施例公开一种基于生物云平台的甲基化数据分析应用系统,包括:用户界面模块1(可以为WEB图形化用户界面模块)、基本分析模块2和个性化分析模块3;其中,所述用户界面模块1,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块2,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块2,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块1,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块1,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块3,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块3,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块1进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。云端数据库中不仅存储有甲基化测序数据,还可以存储基本分析模块的初步分析结果以及个性化分析模块的进一步分析结果。云端数据库中的数据来自于SRA、GEO、NCBI、Ensembl、UCSC中任意一种数据库。云端数据库中的数据还可以是除上述数据库以外其他数据库。本专利技术实施例提供的基于生物云平台的甲基化数据分析应用系统,用户可以采用专业的生物信息分析方法对指定的甲基化测序数据进行分析,最终以图表呈现。整合多种分析方法,将数据分析做到具有个性化的特点,使得数据分析方式不再局限于传统生物信息分析的局限性,使普通用户也可实现对甲基化测序数据进行分析,并极大地丰富了对甲基化测序数据的解读性,提高对测序数据的处理效率,而且,用户指定的甲基化测序数据可以从云端数据库获取,从而能够节省本地磁盘空间。在前述装置实施例的基础上,所述甲基化测序数据质量控制的过程为:识别所述待分析的甲基化测序数据的质量值的编码方式,并将不符合编码方式要求的数据的质量值转换为统一编码标准,基于转换后的质量值统计数据的碱基质量分布和碱基类型分布,并绘制分布图。在前述装置实施例的基础上,所述与参考基因组比对,主要使用Bismark软件工具包实现。由于样品经过重亚硫酸盐处理,基因组上所有的未甲基化的胞嘧啶都转化成了尿嘧啶;经过聚合酶链式反应尿嘧啶转化为了胸腺嘧啶;而原本甲基化的胞嘧啶没有改变;比对时将参考基因组和测序序列分别进行胞嘧啶全部转化为胸腺嘧啶、鸟嘌呤转化为腺嘌呤的处理,并分别将处理后的两种序列和两种基因组分别进行比对,选取四次比对中最优的比对作为比对结果,基于比对结果统计比对效率、基因组覆盖情况、插本文档来自技高网...
基于生物云平台的甲基化数据分析应用系统

【技术保护点】
一种基于生物云平台的甲基化数据分析应用系统,其特征在于,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。...

【技术特征摘要】
1.一种基于生物云平台的甲基化数据分析应用系统,其特征在于,包括:用户界面模块、基本分析模块和个性化分析模块;其中,所述用户界面模块,用于获取第一用户请求,并将所述第一用户请求发送给所述基本分析模块,其中,所述第一用户请求包括待分析的甲基化测序数据路径、第一分析项目的名称和参考基因组版本;所述基本分析模块,用于对所述第一用户请求进行解析,根据解析的结果,从云端数据库获取待分析的甲基化测序数据和参考基因组,根据所述第一分析项目的名称,对所述甲基化测序数据进行初步分析,得到初步分析的结果,并将所述初步分析的结果发送给所述用户界面模块,其中,所述初步分析包括:所述甲基化测序数据质量控制、所述甲基化测序数据与所述参考基因组比对、甲基化位点判定、绘制物种甲基化图谱、差异甲基化区域识别和/或与差异甲基化区域相关联的基因的数据库注释;所述用户界面模块,还用于对所述初步分析的结果进行展示,获取第二用户请求,并将所述第二用户请求发送给所述个性化分析模块,其中,所述第一用户请求包括用户从所述初步分析的结果中选择的待进行进一步分析的内容和第二分析项目的名称;所述个性化分析模块,用于对所述第二用户请求进行解析,根据解析的结果,根据所述第二分析项目的名称对所述待进行进一步分析的内容进行进一步分析,得到进一步分析的结果,并将所述进一步分析的结果发送给所述用户界面模块进行呈现,其中,所述进一步分析包括:甲基化水平分析、差异甲基化水平分析、绘制甲基化水平Circos图和/或与转录组结果进行联合分析。2.根据权利要求1所述的系统,其特征在于,所述甲基化测序数据质量控制的过程为:识别所述待分析的甲基化测序数据的质量值的编码方式,并将不符合编码方式要求的数据的质量值转换为统一编码标准,基于转换后的质量值统计数据的碱基质量分布和碱基类型分布,并绘制分布图。3.根据权利要求2所述的系统,其特征在于,所述甲基化测序数据与所述参考基因组比对的过程为:将测序序列的胞嘧啶全部转化为胸腺嘧啶,命名为CT序列,将测序序列的鸟嘌呤转换为腺嘌呤,命名为GA序列,同时将参考基因组的胞嘧啶全部转化为胸腺嘧啶,命名为CT基因组,将参考基因组的鸟嘌呤转换为腺嘌呤,命名为GA基因组,将转换后的CT序列和转换后GA的序列分别和CT基因组、GA基因组进行比对,选取四次比对中最优的比对作为比对结果,最后根据比对结果统计比对效率、基因组覆盖情况以及插入片段的大小分布。4.根据权利要求3所述的系统,其特征在于,所述甲基化位点判定的过程为:基于所述甲基化测序数据与所述参考基因组比对的结果,将所述的最优比对序列和原始的测序序列进行比较,确定该测序序列的甲基化信息,使用二项分布检验,计算出胞嘧啶位点发生了甲基化的...

【专利技术属性】
技术研发人员:资意
申请(专利权)人:北京百迈客生物科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1