用于生化数据分析的系统和方法技术方案

技术编号:10317530 阅读:129 留言:0更新日期:2014-08-13 18:36
提供了用于生化数据分析的方法和系统。可接收数据集,并且比较字段的选择可用于创建数据子组以在该数据子集上运行统计分析。数据集的子组可基于比较字段的选择而创建。可计算关于每一数据子组的统计信息,并且在用户显示器上显示该统计信息。可提供信息用于进一步的数据集精炼。用户可供应对照组选择,并且这种选择随后可导致显示器上的关于哪一群体表示对照组的指示。用户可供应信息以供进一步的数据集过滤。这种信息可用于在创建统计分析的子组之前过滤数据。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2011年9月22日提交的题为“(Systems and Methods for Biochemical Data Analysis) ”的美国临时申请号61/538,073的优先权,并且是该临时申请的非临时申请,该临时申请的全部内容出于所有目的通过引用结合于此。
技术介绍
本专利技术一般涉及生化数据分析,并且更具体地涉及使用用户供应的参数对生化数据的分析。生化实验数据分析大部分以手动的方式继续。用户经由各种实验手段获取与在生物样品上进行的研究有关的实验数据,包括软件程序输出的结果。这种数据可具有大量的各种各样的特性,并且因此难以管理和分析。当前用户常常采用Excel,执行许多手动步骤以用于将数据导入电子数据表(spreadsheet)、用于从整个数据集中选择数据类别以供评估和比较、以及用于提供宏以供统计计算和制图表。手动方案对用户来说难以实现和管理、耗时、易于出错、并且存在潜在的商业风险。用户当前尚未拥有易于使用的界面和系统用于容易地提供关于如何对数据集分段(slice)的信息,导致数据子集、统计信息用户视图的自动更新、和/或重新计算数据(例如,对数据和图表的统计)。因此,期望提供克服以上以及其他问题的系统和方法。
技术实现思路
实施例可提供用于生化数据分析的方法和系统。例如,可接收数据集,并且对比较字段的选择可用于创建数据子组来在该数据子组上运行统计分析。可基于对比较字段的选择而创建数据集的子组。可计算关于每一数据子组的统计信息,并且在用户显示器上显示该统计信息。在各个方面,提供其他信息以用于进一步的数据集精炼。在一方面,用户可供应对照组选择。然后,这种选择可导致在显示器上产生哪一群体(population)代表对照组的指示。在另一方面,用户可供应信息以供进一步的数据集过滤。这种信息可用于在创建统计分析的子组之前过滤数据。根据一个实施例,提供了一种生化数据分析的方法。计算机系统接收多个生物样品的数据集。数据集具有用于每一生物样品的多个字段,其中数据集的至少一部分从涉及生物样品的实验中获取。数据集包括多个第一字段。每一第一字段包括多个值,每一值对应于各个生物样品的各个特性。数据集可包括一个或多个第二字段。每一第二字段对应于各个分析物,并且包括实验中的各个分析物的多个浓度。各个第二字段中的每一浓度对应于各个生物样品。从多个第一字段接收对比较字段的选择。计算机系统基于比较字段的多个值,来标识数据集中的生物样品的子组以用于统计分析。子组具有用于比较字段的相同值。从统计分析的一个或多个第二字段接收对分析物的选择。提供以子组分开的信息的显示,从而为比较字段的每一子组传达所选分析物的统计信息。其他实施例涉及与本文中所描述的方法相关联的系统、装置、以及计算机可读介质。对说明书的其余部分(包括附图和权利要求)的参考将了解本专利技术的其他特征和优点。在下文中参考附图详细地描述本专利技术的其他特征和优点、以及本专利技术的各个实施例的结构和操作。在附图中,相似的附图标记可指示相同或功能类似的要素。【附图说明】在附图中,相似的附图标记用于引用相似的要素。虽然以下附图描绘本专利技术的各个示例,但是本专利技术不限于在附图中描绘的示例。图1A是示出运行生化分析组件的实例的生化分析系统的框图。图1B是示出生化分析应用的实施例的各个GUI组件的框图。图2是示出生化数据分析系统的步骤的流程图。图3示出生化分析系统的一个实施例的Π页面的屏幕截图,该屏幕截图示出其中未选择比较字段且未选择对照组的屏幕。图4是生化分析系统的一个实施例的Π页面的屏幕截图,该屏幕截图示出用于选择比较字段的下拉列表和所产生的组比较。图5是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于选择对照组的下拉列表和所产生的组的重新组织以及相关联计算。图6是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于添加性别的过滤参数的下拉列表和所产生的计算的数据更新的缩减。图7是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于添加样品ID的过滤参数的下拉列表。图8是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于选择过滤标准的复选框。图9是示出统计概要的生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出其中比较字段被选为“条件”、对照组被选为“正常(normal) ”、过滤条件被设为“条件”、以及所有条件被选为过滤标准的视图。图10是根据本专利技术的实施例的UI页面的散布图1000。图11是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出该系统的数据修改和注释的一个示例。图12不出可与根据本专利技术实施例的系统和方法一起使用的不例计算机系统1200的框图。【具体实施方式】研究人员以及其他用户在生物样品上运行各种实验(例如,对血样的实验以确定各种分析物的浓度)。然后,这些用户可能要求对从各实验中采集的数据进行分析。可通过将从实验中获取的数据导入数据库并使用各种工具来分析所导入数据,来执行分析。在一些情况下,用户可能想要对实验数据执行统计分析以获得对数据群体的特性的洞察。作为示例,可对聚合酶链反应(PCR)数据或者来自其他生化过程的任何其他数据执行分析。以下是其他数据的示例。免疫测定(immunoassay)数据可源自任何平台(例如,基于平板的酶联免疫吸附测定(ELISA)、具有包括平面阵列、基于珠的测定、流式细胞术、以及其他测量技术的任何风格(flavor)的多重平台),可使用原始荧光或者源自校准曲线的经计算的浓度。实时PCR数据可使用相对量(也称为归一化量或倍数表示)或者源自校准曲线的经计算的值。微阵列数据通常使用原始荧光值(这些值可通过一些背景减除被修改)。质谱数据通常使用峰值以下的区域。其它数据可包括:肺功能数据,诸如通常以排出空气的体积来测量的肺功能;血液化学(例如针对HDL、胆固醇、肝酶素等等的测试);以及物理测量结果,诸如骨密度、骨长度、和踝关节周长(例如,来测量膨胀和实验动物)。可将研究数据导入数据库,然后通过应用来分析,该应用接受各种用户参数以计算该数据集的统计结果,并向该用户提供与计算有关的信息。因此,各实施例可提供对于数据的用户定义的参数设定,该参数设定可用于将数据集划分成数据子集以进行统计分析。可分析这些数据子集以按照每个数据子组提供数据表示和/或统计信息的经更新的用户视图。用户可提供统计分析的某些参数。例如,用户可提供选择,诸如比较字段、对照组、统计测试类型、过滤参数、以及过滤标准。比较字段可表示研究人员在为统计分析而划分数据集时感兴趣的字段。对于从对于多个生物样品的实验获得的包含针对每个样品的与癌症类型有关的信息的数据集,研究人员可能对研究每种特殊癌症类型的子群体中的特性(例如特定分析物的浓度,等等)感兴趣。在该情况下,用户可选择“疾病状况”字段作为所选择的比较字段。对照组可表示数据中被视为实验对照的子组或子群体。例如,如上所讨论地在“疾病状况”被选择为比较字段的情况下,可将“正常”或“健康个体”的数据值选择为对照组。这样的组可提供基线,可将数据集的所有其它子群体与该基线作比较。此外,研究人员可能对进一步过滤数据集以获得对于数据集的各种特性的洞察感兴趣。例如,继续上述本文档来自技高网...

【技术保护点】
一种生化数据分析的方法,所述方法包括:在计算机系统处接收多个生物样品的数据集,所述数据集对每一生物样品具有多个字段,所述数据集的至少一部分从涉及所述生物样品的实验中获取,其中所述数据集包括:多个第一字段,每一第一字段包括多个值,每一值对应于各个生物样品的各个特性,以及一个或多个第二字段,每一第二字段对应于各个分析物并且包括所述实验中的各个分析物的多个浓度,每一浓度对应于各个生物样品;接收来自所述多个第一字段的比较字段的选择;通过所述计算机系统基于所述比较字段的多个值,来标识所述数据集中的所述生物样品的子组以用于统计分析,其中子组具有所述比较字段的相同值;接收来自统计分析的所述一个或多个第二字段的分析物的选择;以及提供按照子组分开的信息的显示,从而针对所述比较字段的每一子组传达所选分析物的统计信息。

【技术特征摘要】
【国外来华专利技术】2011.09.22 US 61/538,0731.一种生化数据分析的方法,所述方法包括: 在计算机系统处接收多个生物样品的数据集,所述数据集对每一生物样品具有多个字段,所述数据集的至少一部分从涉及所述生物样品的实验中获取,其中所述数据集包括:多个第一字段,每一第一字段包括多个值,每一值对应于各个生物样品的各个特性,以及 一个或多个第二字段,每一第二字段对应于各个分析物并且包括所述实验中的各个分析物的多个浓度,每一浓度对应于各个生物样品; 接收来自所述多个第一字段的比较字段的选择; 通过所述计算机系统基于所述比较字段的多个值,来标识所述数据集中的所述生物样品的子组以用于统计分析,其中子组具有所述比较字段的相同值; 接收来自统计分析的所述一个或多个第二字段的分析物的选择;以及提供按照子组分开的信息的显示,从而针对所述比较字段的每一子组传达所选分析物的统计信息。2.如权利要求1所述的方法,其特征在于,提供按照子组分开的信息的显示包括: 显示每一子组的图表,其中每一图表显示所述子组沿着浓度值的轴的每一浓度。3.如权利要求1所述的 方法,其特征在于,还包括: 接收来自对照组列表的对照组的选择;以及 在统计信息的显示上提供关于哪个子组对应于所述对照组的可视指示。4.如权利要求3所述的方法,其特征在于,还包括: 基于对所述比较字段的选择来更新所述对照组列表,其中所述对照组表示来自所述比较字段的所述多个值的特定数据值。5.如权利要求3所述的方法,其特征在于,所述统计信息的显示包括一系列图表,每一图表对应于不同的子组,并且其中所述可视指示包括以左对齐的方式显示与所述对照组相对应的图表。6.如权利要求1所述的方法,其特征在于,还包括: 接收来自过滤参数列表的第一过滤参数的选择,其中所述过滤参数列表包括所述多个第一字段的至少一部分,所述第一过滤参数具有多个第一标准值; 接收所述多个第一标准值的一部分的选择;以及 显示与所选择部分相对应且不与未选择的第一标准值相对应的统计信息。7.如权利要求6所述的方法,其特征在于,还包括: 基于所选过滤参数刷新可能的标准值的用户视图,其中所述可能的标准值允许过滤被执行统计分析的数据; 基于所刷新的用户视图来接收标准值的一个或多个用户选择;以及 基于所选过滤标准来过滤统计分析的数据的子组。8.如权利要求6所述的方法,其特征在于,还包括: 接收来自所述过滤参数列表的第二过滤参数的选择,所述第二过滤参数具有多个第二标准值; 接收所述多个第二标准值的一部分的选择;以及 显示与所述第一和第二标准值的所选择部分相对应且不与未选择的第一和第二标准值相对应的统计信息。9.如权利要求6所述的方法,其特征在于,所述第一过滤参数不是所述比较字段。10.如权利要求1所述的方法,其特征在于,还包括: 接收对统计分析的类型的选择; 基于所接收的统计分析的类型来计算与所选择分析物相对应的数据的一个或多个统计值;以及 显示所述一个或多个统计值。11.如权利要求10所述的方法,其特征在于,还包括: 在表中显示分析物的列表, 其中从统计分析的所述一个或多个第二字段接收对分析物的选择包括:接收所述表中的分析物的选择,并且 其中在所述表中以与所选择分析物相对应的一个或多个单元格中显示所述一个或多个统计值。12.如权利要求1所述的方法,其特征在于,还包括: 接收所述多个生物样品的数据集的自定义属性的定义,其中所述自定义属性是与所述多个第一字段之一相对应的用户供应的属性。13.如权利要求1所述的方法,其特征在于,所述一个或多个第二字段中的至少一个对应于作为相应分析物的细胞类型。14....

【专利技术属性】
技术研发人员:T·耶克N·K·汤姆森J·C·达纳韦
申请(专利权)人:生物辐射实验室股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1