用于生成数据格式描述语言模型的方法和装置制造方法及图纸

技术编号:13078010 阅读:38 留言:0更新日期:2016-03-30 12:22
公开一种用于生成数据格式描述语言DFDL模型的方法,包含:获取按照注释规则对样本数据添加的注释;根据所述注释规则和所获取的对样本数据添加的注释,创建逻辑模型和配置文件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定义在所述逻辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和根据所述逻辑模型和所述配置文件生成样本数据对应的DFDL模型。

【技术实现步骤摘要】

本专利技术涉及数据格式描述语言值抑L),尤其涉及D抑L模型(Schema)的生成工具。
技术介绍
数据格式描述语言是描述文本(text)数据格式和二进制数据格式的一种规范。 目前已经出现了能利用D抑L模型将非结构化数据转换为符合D抑L规范值抑L specification)的结构化数据或将符合DFDL规范的结构化数据转换为非结构化数据的技 术实现,随着D抑L的更多应用,D抑L模型的生成,变得越来越重要。D抑L模型由逻辑模型 和DFDL注释构成。现有技术中存在用于手工生成DFDL模型的工具,送种工具对使用者的 要求较高,例如要求使用者根据样本数据手工地创建逻辑模型,并向逻辑模型添加相应的 D抑L注释,因此要求使用者既要熟悉样本数据的语义,又要熟悉D抑L规范。送对使用者提 出极大的挑战。
技术实现思路
本专利技术的一个目的是提供一种简化D抑L模型的生成的方法和装置。 -方面,提供一种用于生成数据格式描述语言D抑L模型的方法,包含: 获取按照注释规则对样本数据添加的注释; 根据所述注释规则和所获取的对样本数据添加的注释,创建逻辑模型和配置文 件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定义在所述逻 辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和 根据所述逻辑模型和所述配置文件生成样本数据对应的D抑L模型。 另一方面,提供一种用于生成数据格式描述语言D抑L模型的装置,包含: 注释获取模块,被配置用于获取按照注释规则对样本数据添加的注释; 分析工具,被配置用于根据所述注释规则和对样本数据添加的注释,创建逻辑模 型和配置文件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定 义在所述逻辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和 DFLDL模型生成器,被配置用于根据所述逻辑模型和所述配置文件生成样本数据 对应的D抑L模型。 采用本专利技术,用户只需熟悉样本数据的结构和语义,即使不熟悉DFDL规范,也能 自动地生成样本数据对应的D抑L模型。【附图说明】 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述W及其 它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。 图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框 图; 图2例示D抑L模型、D抑L文档和非结构化数据之间的关系; 图3示意性表示按照专利技术实施例的用于生成D抑L模型的方法的流程图;[001引图4A示出一个样本数据的例子; 图4B示出一个用于标注样本数据的语义的人机界面的局部; 图4C表示按照专利技术实施例产生的标注了语义的样本数据; 图5示意性地表示按照专利技术实施例的分析标注了语义的样本数据的树状结构的 过程; 图6A和6B例示按照专利技术实施例创建的逻辑模型和配置文件; 图6C例示按照专利技术实施例根据图6A和她所示逻辑模型和配置文件生成的D抑L 模型。 图7示意性表示按照专利技术实施例的用于生成D抑L模型的装置的简略框图。【具体实施方式】下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可W W各种形式实现本公开而不应被送里阐述的实施方 式所限制。相反,提供送些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整地传达给本领域的技术人员。 图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框 图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本专利技术实施例的功能和使 用范围带来任何限制。 如图1所示,计算机系统/服务器12 W通用计算设备的形式表现。计算机系统 /服务器12的组件可W包括但不限于;一个或者多个处理器或者处理单元16,系统存储器 28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器, 外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举 例来说,送些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC) 总线,增强型ISA总线、视频电子标准协会(VESA)局域总线W及外围组件互连(PCI)总线。 计算机系统/服务器12典型地包括多种计算机系统可读介质。送些介质可W是 任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动 的和不可移动的介质。 系统存储器28可W包括易失性存储器形式的计算机系统可读介质,例如随机存 取存储器(RAM) 30和/或高速缓存存储器32。计算机系统/服务器12可W进一步包括其 它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34 可W用于读写不可移动的、非易失性磁介质(图1未显示,通常称为"硬盘驱动器")。尽管 图1中未示出,可W提供用于对可移动非易失性磁盘(例如"软盘")读写的磁盘驱动器, W及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。 在送些情况下,每个驱动器可W通过一个或者多个数据介质接口与总线18相连。存储器28 可W包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,送些程序模 块被配置w执行本专利技术各实施例的功能。 具有一组(至少一个)程序模块42的程序/实用工具40,可W存储在例如存储器 28中,送样的程序模块42包括一但不限于一操作系统、一个或者多个应用程序、其它 程序模块W及程序数据,送些示例中的每一个或某种组合中可能包括网络环境的实现。程 序模块42通常执行本专利技术所描述的实施例中的功能和/或方法。 计算机系统/服务器12也可W与一个或多个外部设备14 (例如键盘、指向设备、 显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的 设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信 的任何设备(例如网卡,调制解调器等等)通信。送种通信可W通过输入/输出(I/O)接 口 22进行。并且,计算机系统/服务器12还可W通过网络适配器20与一个或者多个网络 (例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适 配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示 出,可W结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于;微代 码、设备驱动器、兀余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器W及数据备份存 储系统等。 图1所示的计算机系统/服务器12,适于用来实现本专利技术的各种实施方式。 首先参看图2,图2例示D抑L模型、D抑L文档和非结构化数据之间的关系。具体 来说,图2中显示了一个非结构化的数据流"Intval = 5 ;fltval = -7. 1E8"210、一个D抑L 处理器220、一个D抑L文档230和一个事先生成的D抑L模型255。 如所属
的技术人员知道的郝样,D抑L模型255由逻辑模型和D抑L注释 (annotation)组成。逻辑模型也称"D抑本文档来自技高网
...

【技术保护点】
一种用于生成数据格式描述语言DFDL模型的方法,包含:获取按照注释规则对样本数据添加的注释;根据所述注释规则和所获取的对样本数据添加的注释,创建逻辑模型和配置文件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定义在所述逻辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和根据所述逻辑模型和所述配置文件生成样本数据对应的DFDL模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱朴黄福伟翟小东高甜甜
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1