System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 组学数据分析报告自动生成方法、装置及计算机设备制造方法及图纸_技高网

组学数据分析报告自动生成方法、装置及计算机设备制造方法及图纸

技术编号:40671904 阅读:6 留言:0更新日期:2024-03-18 19:08
本发明专利技术提供一种组学数据分析报告自动生成方法、装置及计算机设备,该方法包括:加载选定的Markdown文本模板并将其进行分割以形成多个子模板;将每一子模板逆向转换成可执行的文本形式的Markdown代码以形成子模板代码块;获取报告所需的数据元素,经预处理后获得每一数据元素的项目信息和存储路径;根据每一子模板代码块的调用对象,匹配数据元素的项目信息以查找到该子模板代码块所需的数据元素,并基于该数据元素的存储路径以获取所需数据元素,将获得的数据元素调用或填充入该子模板代码块内的调用对象,并标记该子模板代码块;提取被标记的子模板代码块并根据Markdown文本模板所规定的顺序进行依次拼接;渲染拼接后的代码以自动生成与报告所需的数据元素相关联的组学数据分析报告。

【技术实现步骤摘要】

本专利技术涉及生物医药组学分析,且特别涉及一种组学数据分析报告自动生成方法、装置及计算机设备


技术介绍

1、生物医药领域的科研主要以数据为驱动力,传统的研究方法产生的数据较少,分析方法也很简单,通常以描述和推断为主。而如今各种高通量平台(测序、质谱等)产出的数据量通常十分庞大,亟需采用计算机手段进行常规的数据处理和深入挖掘。目前对于生物大数据的统计分析主要有两种方式,一种是通过spss、prism等专用平台来实现的;而另一种则是分析人员使用r、python等语言进行交互式数据分析,依托海量的第三方软件包实现复杂的统计过程(如建模、调参、验证等)以及丰富的数据可视化。对于spss、prism等专用软件而言,其不仅使用成本高且分析方法较为固定,不仅存在使用深度和操作空间不足的问题且通常还需进行手动操作而难以实现组分的自动分析。

2、而对于以r、python等语言为基础的交互式数据分析,尽管其分析方式较为灵活,但在出具组学数据分析报告时仍然只能使用固定的报告模板(如markdown文本模板)进行统一输出。然而,交互式数据分析的灵活性允许用户对分析环境进行个性化定制,各个分析环节的结果也会随着输入参数的变化而产生许多分支,不同的分支会对应不同的数据报告。当前为兼容所有个性化定制,报告模板将涵盖所有分支的输出;但多分支的兼容将会导致生成的报告中存在很多无数据的冗余项目,这些冗余项目会对用户阅读报告造成干扰,用户难以从报告中直观地获取所需分析数据的结果。此外,基于固定格式的报告将难以实现静态元素(文字、图片、标题等)的修改而存在灵活性差等问题。


技术实现思路

1、本专利技术为了克服现有技术的不足,提供一种适用于交互式数据分析且报告结果与分析数据高度相关的组学数据分析报告自动生成方法、装置及计算机设备。

2、为了实现上述目的,本专利技术提供一种组学数据分析报告自动生成方法,其包括:

3、加载选定的markdown文本模板并将其进行分割以形成多个子模板;

4、通过python提供的文本操作工具将每一子模板逆向转换成可执行的文本形式的markdown代码以形成子模板代码块;

5、获取报告所需的数据元素,经预处理后获得每一数据元素的项目信息和存储路径;

6、根据每一子模板代码块的调用对象,匹配数据元素的项目信息以查找到该子模板代码块所需的数据元素,并基于该数据元素的存储路径以获取所需数据元素,将获得的数据元素调用或填充入该子模板代码块内的调用对象,并标记该子模板代码块;

7、提取被标记的子模板代码块并根据markdown文本模板所规定的顺序进行依次拼接;

8、渲染拼接后的代码以自动生成与报告所需的数据元素相关联的组学数据分析报告。

9、根据本专利技术的一实施例,组学数据分析报告自动生成方法还包括:

10、解析分割后所生成的多个子模板之间的关系;

11、在提取到进行数据填充的所有子模板代码块后,基于每一子模板代码块所对应的子模板和其它子模板之间的相关性,获取关联模板代码块;

12、填充关联模板代码块;

13、根据markdown文本模板所规定的顺序依次拼接所有子模板代码块和对应的关联模板代码块。

14、根据本专利技术的一实施例,在对markdown文本模板进行分割时将其分割成仅包括文本格式的固定子模板和与数据元素相关联的动态子模板,获取每一动态子模板代码块所需的数据元素并进行填充。

15、根据本专利技术的一实施例,在将每一子模板逆向转换成子模板代码块时,存储每一子模板内的静态元素并将每一静态元素的存储地址关联至子模板代码块内;

16、在渲染拼接后的代码时根据预生成的可修改css文件内的参数渲染每一子模板代码块内所关联的静态元素,css文件为基于用户需求可修改的文件。

17、根据本专利技术的一实施例,报告所需的数据元素包括前端分析数据、统计图以及用户输入参数,统计图经数字压缩后与文本格式的前端分析数据和用户输入参数放置于同一存储文件夹内。

18、根据本专利技术的一实施例,用户输入参数包括组学数据分析时输入的文本和数值、下拉列表选项内的选项信息以及检查框信息;用户输入参数经类型转换后以实参的形式被子模板代码块调用或作为填充变量填充每一子模板代码块。

19、根据本专利技术的一实施例,基于每一数据元素的项目信息、存储路径以及数据内容构建excel格式的数据键值表,在数据填充时根据调用对象查询excel格式的数据键值表以获得每一子模板代码块所需的数据元素。

20、另一方面,本专利技术提供一种组学数据分析报告自动生成装置,其包括分割模块、代码化模块、数据预处理模块、调用填充模块、拼接模块以及渲染模块。分割模块加载选定的markdown文本模板并将其进行分割以形成多个子模板。代码化模块通过python提供的文本操作工具将每一子模板逆向转换成可执行的文本形式的markdown代码以形成子模板代码块。数据预处理模块获取报告所需的数据元素,经预处理后获得每一数据元素的项目信息和存储路径。调用填充模块根据每一子模板代码块的调用对象,匹配数据元素的项目信息以查找到该子模板代码块所需的数据元素,并基于该数据元素的存储路径以获取所需数据元素,将获得的数据元素调用或填充入该子模板代码块内的调用对象,并标记该子模板代码块。拼接模块提取被标记的子模板代码块并根据markdown文本模板所规定的顺序进行依次拼接。渲染模块渲染拼接后的代码以自动生成与报告所需的数据元素相关联的组学数据分析报告。

21、根据本专利技术的一实施例,还包括解析模块,解析模块解析分割后所生成的多个子模板之间的关系;且在提取到进行数据填充的所有子模板代码块后,基于每一子模板代码块所对应的子模板和其它子模板之间的相关性,获取关联模板代码块;

22、调用填充模块,填充关联模板代码块;

23、拼接模块,根据markdown文本模板所规定的顺序依次拼接所有子模板代码块和对应的关联模板代码块。

24、另一方面,本专利技术还提供一种组学数据分析系统,其包括组学数据分析装置和组学数据分析报告自动生成装置。组学数据分析装置对单个样本进行单变量分析或多变量分析,或者对多个组间样本的比较分析。组学数据分析报告自动生成装置获取组学分析装置产生的分析数据和用户输入参数以形成报告所需的数据元素,并采用上述方法自动生成组学数据分析报告。

25、根据本专利技术的一实施例,组学数据分析报告自动生成装置的输出界面集成于组学数据分析装置的输入界面,组学分析装置的输入界面上配置有多个动态组件,用户基于多个动态组件为样本的组学数据分析配置的输入参数,动态组件为下拉框、单选框或复选框中的任一种。

26、另一方面,本专利技术还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述组学数据分析报告自动生成方法的步骤。

27、另一方面,本本文档来自技高网...

【技术保护点】

1.一种组学数据分析报告自动生成方法,其特征在于,包括:

2.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,所述组学数据分析报告自动生成方法还包括:

3.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,在对Markdown文本模板进行分割时将其分割成仅包括文本格式的固定子模板和与数据元素相关联的动态子模板,获取每一动态子模板代码块所需的数据元素并进行填充。

4.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,在将每一子模板逆向转换成子模板代码块时,存储每一子模板内的静态元素并将每一静态元素的存储地址关联至子模板代码块内;

5.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,所述报告所需的数据元素包括前端分析数据、统计图以及用户输入参数,所述统计图经数字压缩后与文本格式的前端分析数据和用户输入参数放置于同一存储文件夹内。

6.根据权利要求5所述的组学数据分析报告自动生成方法,其特征在于,所述用户输入参数包括组学数据分析时输入的文本和数值、下拉列表选项内的选项信息以及检查框信息;所述用户输入参数经类型转换后以实参的形式被子模板代码块调用或作为填充变量填充每一子模板代码块。

7.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,基于每一数据元素的项目信息、存储路径以及数据内容构建excel格式的数据键值表,在数据填充时根据调用对象查询excel格式的数据键值表以获得每一子模板代码块所需的数据元素。

8.一种组学数据分析报告自动生成装置,其特征在于,包括:

9.根据权利要求8所述的组学数据分析报告自动生成装置,其特征在于,还包括解析模块,所述解析模块解析分割后所生成的多个子模板之间的关系;且在提取到进行数据填充的所有子模板代码块后,基于每一子模板代码块所对应的子模板和其它子模板之间的相关性,获取关联模板代码块;

10.一种组学数据分析系统,其特征在于,包括:

11.根据权利要求10所述的组学数据分析系统,其特征在于,所述组学数据分析报告自动生成装置的输出界面集成于组学数据分析装置的输入界面,所述组学分析装置的输入界面上配置有多个动态组件,用户基于所述多个动态组件为样本的组学数据分析配置的输入参数,所述所述动态组件为下拉框、单选框或复选框中的任一种。

12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种组学数据分析报告自动生成方法,其特征在于,包括:

2.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,所述组学数据分析报告自动生成方法还包括:

3.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,在对markdown文本模板进行分割时将其分割成仅包括文本格式的固定子模板和与数据元素相关联的动态子模板,获取每一动态子模板代码块所需的数据元素并进行填充。

4.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,在将每一子模板逆向转换成子模板代码块时,存储每一子模板内的静态元素并将每一静态元素的存储地址关联至子模板代码块内;

5.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,所述报告所需的数据元素包括前端分析数据、统计图以及用户输入参数,所述统计图经数字压缩后与文本格式的前端分析数据和用户输入参数放置于同一存储文件夹内。

6.根据权利要求5所述的组学数据分析报告自动生成方法,其特征在于,所述用户输入参数包括组学数据分析时输入的文本和数值、下拉列表选项内的选项信息以及检查框信息;所述用户输入参数经类型转换后以实参的形式被子模板代码块调用或作为填充变量填充每一子模板代码块。

7.根据权利要求1所述的组学数据分析报告自动生成方法,其特征在于,基于每一数...

【专利技术属性】
技术研发人员:陈荣昌全胜孔子青刘华芬
申请(专利权)人:湖南凯莱谱生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1