基于技术设计文档的数据转换制造技术

技术编号:4226776 阅读:162 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了基于技术设计文档的数据转换。具体地,通过首先获取包括用于将输入数据转换为输出数据的规则的非机器可执行表达式的技术设计文档而发起数据转换。在一个实施方式中,利用图形用户界面来指定如何获取技术设计文档,以及指派输入数据和输入数据的位置。之后,对技术设计文档进行解析,使得规则的非机器可执行表达式可以用作生成机器可执行转换表达式的基础。得到的机器可执行转换表达式可选地可以进行存储,并且随后应用于驻留在一个或多个适当的存储库中的输入数据。通过这种方式,本技术不需要使用数据转换工具来捕获数据转换规则,而是依靠直接从技术设计文档捕获规则,由此提高效率和准确性。

【技术实现步骤摘要】

本公开一般地涉及用于转换数据的方法,具体地,涉及用于基于对期望的数据转换进行描述的技术设计文档而有效地生成计算机可执行的转换表达式的技术。本公开一般 地还涉及可以用于实施数据转换方法的设备。本公开进一步一般地涉及可以实施数据转换 方法的系统。
技术介绍
在这个所谓信息时代,数据转换,也即将数据从一种形式修改和/或重新安排成 另一种形式,已经变成一项无处不在的任务。尽管很多数据转换任务相对较简单,但是很多 其他数据转换任务非常复杂,并且对不能按照设计正确转换数据负主要责任。例如,在制药 和/或医疗器械行业,需要进行临床试验,以便协助采集针对新药物或新设备的大量安全 性数据和功效数据。 取决于产品的类型及其研发阶段,临床试验最初通常招募健康志愿者和/或病人 进行小规模研究,之后针对病人进行较大规模研究,其通常将新产品与普遍接受的标准治 疗过程进行比较(也即,基于当前可用制药或设备(如果有的话)的治疗)。 一般而言,在 较大规模功效试验期间,随着正面安全性数据的收集,病人的数量通常会增多。无论给定临 床试验的类型和规模如何,在临床试验期间获得的数据必须提交给负责的政府管理机构,以便全面审查正在研发的新产品。例如在美国,食品及药物管理局(FDA)负责新药物和医 疗器械的批准。 临床数据交换标准协会(CDISC)在研发用于帮助FDA对安全性数据和功效数据 实施审查和批准过程的标准方面投入了大量精力。此标准格式有时称为研究数据表格模 型(SDTM)格式。把在临床试验期间捕获的数据(该数据在形式和内容上可以有非常大的 变化)转换为期望的SDTM格式的需求正在增长。典型地,数据转换分为两步骤首先,数 据映射将数据元素从源映射到目标,并且捕获必须发生的任何转换;其次,执行代码生成 以创建必需的转换程序,也即可以在计算机系统上运行的可执行软件程序。在典型的转 换过程中,创建技术设计文档,例如指定了如何根据特定SDTM变量将输入数据映射到输 出数据的基于元数据的映射图表,以便建立必要的映射规则。例如,通常以电子表格的形 式捕获技术设计文档,其中每行列出了期望的数据转换。此后,利用数据转换工具(诸如 CSS Informatics的"Tabletrans (表格转换)"可视数据库编程软件或SAS软件研究所的 "SAS"Data Integration Studio可视设计工具)来开始设计转换程序。这种设计转换工 具利用图形用户界面(GUI),在该GUI中,可以根据需要、按照技术设计文档中描述的转换 规则来布置和排列代表各种转换操作的图标。每个图标代表以基础统计学或数据库编程语 言编写的相对成熟的数据处理功能。由于每个图标底层的程序是全面测试过的,因此可以 设计出可靠的数据转换程序。换言之,通过解释经由GUI建立的图标的布置和排列,可以基 于预先构建的功能生成更复杂的数据转换程序。 对于单次临床试验而言,需要创建如上所述的15-20个不同的数据转换程序并不罕见。考虑到这个,假设有3-4个资源工作于上述转换程序,开发新研究的整个过程通常需 要至少15-20天。即使使用数据转换工具,目前总的数据映射过程仍然是冗长的过程,有时 候在从技术设计文档捕捉要求时容易出错。 尽管上述临床试验示例示出了现有技术的某些缺陷,但是可以理解这些局限并不 是临床试验中所用的数据转换领域特有的。其实,实际上任何需要相对复杂数据转换的努 力,例如财务交易中的数据分析,都会遭遇同样的缺陷。因此,有利的是提供克服现有技术 的局限的数据转换技术、数据转换设备和系统。
技术实现思路
本公开描述了用于转换数据的技术,其基本上不需要如上所述的数据转换工具。 这是通过首先获取包括用于将输入数据转换为输出数据的规则的非机器可执行表达式的 技术设计文档而实现的。在一个实施方式中,利用图形用户界面来指定如何获取技术设计 文档。也可以利用图形用户界面来指派输入数据和输入数据的位置。之后,对技术设计文档 进行解析,使得规则的非机器可执行表达式可以用作生成机器可执行转换表达式的基础。 例如,机器可执行转换表达式可以包括本领域公知的适合的查询语言表达式。得到的机器 可执行转换表达式可选地可以进行存储,并且随后应用于驻留在一个或多个适当的存储库 中的输入数据。通过这种方式,此处所描述的技术不需要使用数据转换工具来捕获数据转 换规则,而是依靠直接从技术设计文档捕获规则,由此提高效率和准确性。本公开还描述了 可以用于实施数据转换方法的设备,并且进一步公开了可以实现上述数据转换方法和数据 转换设备的系统。附图说明 本公开中所描述的特征在所附权利要求中具体阐述。这些特征及其带来的优点从 以下结合附图的详细描述中将变得明显。现在仅作为示例,参考附图描述一个或多个实施 方式,附图中类似的参考标记表示类似的元素,其中 图1是根据此处所描述的各种实施方式、用于实施转换数据的技术的系统框图; 图2是根据此处所描述的各种实施方式、用于转换数据的装置(或者称为数据转 换设备)的框图; 图3是示出了根据此处所描述的一个实施方式的处理的流程图; 图4示出了结合此处所描述的各种实施方式使用的数据转换设备可以输出的图形用户界面的示例;以及 图5示出了可以结合此处所描述的各种实施方式一起使用的技术设计文档的示 例。具体实施例方式现在参考图l,其示出了包括与一个或多个存储库104通信的至少一个数据转换 设备102(为了容易说明,仅示出了一个)的系统。尽管示出了大量细节,但是可以理解,数 据转换设备102可以经由任何便利的通信通道与存储库104通信。例如,在一个实施方式 中,数据转换设备102经由一个或多个适当的网络与存储库104通信,网络包括诸如局域网(LAN)的私有网络和/或诸如因特网或万维网的公共通信网络。并且进一步地,也可以采用 无线通信信道。本领域技术人员将会理解,为此目的可以采用多种适当技术中任何一种,并 且本公开并不局限于此。 如图所示,数据转换设备102包括至少一个处理器110,其耦合到一个或多个存储 组件112、114。例如,在一个实施方式中,提供程序存储组件112,其包括存储的可执行指令 以用于控制一个或多个处理器110的操作;提供另一存储组件114,其包括存储的可以在一 个或多个处理器110上操作的数据。尽管程序存储组件112和其他存储组件114图示为相 互分离,但是在实践中,可以理解存储组件112、114可以使用相同的物理设备来实现。例 如,存储组件112、114可以包括一个或多个易失性和/或非易失性存储器,包括但不限于随 机访问存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPR0M),等等。 一个 或多个存储器110可以包括微处理器、微控制器、数字信号处理器或任何其他组件或其能 够执行所存储的指令以及操作所存储的数据的组合。图l示出的此类处理器和存储装置对 于本领域普通技术人员来说是公知的,并且可以容易地并入各种其他适当的装置。例如,数 据转换设备102可以具体化在桌上型/膝上型/手持型计算机、个人数字助理、移动电话等 之中。无论采用哪种特定类型的设备102,这种装置可以用于实施按照下文描述的各种实施 方式的处理。 在一种实施方式中,设备102包括本文档来自技高网
...

【技术保护点】
一种用于在至少一个处理设备中转换数据的方法,包括:获取技术设计文档,所述技术设计文档包括用于将输入数据转换为输出数据的规则的非机器可执行表达式;解析所述技术设计文档以生成对应于所述规则的机器可执行转换表达式;以及基于所述机器可执行转换表达式,将所述输入数据转换为所述输出数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:SJ瓦西斯塔
申请(专利权)人:埃森哲环球服务有限公司
类型:发明
国别省市:CH[瑞士]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1