基于XML的标准结构化编写生成方法技术

技术编号:17779683 阅读:61 留言:0更新日期:2018-04-22 08:10
本发明专利技术涉及一种基于XML的标准结构化编写生成方法,其步骤如下:制定标准通用的数据模式;基于所构建的各数据模式生成至少1个相应的XML格式的结构化文档;通过XML分析器验证所生成的XML格式的结构化文档是否符合所制定的数据模式;针对所制定的各数据模式中的数据元素,形成样式转换规则,自动将验证通过的XML格式的结构化文档转换成所需要的标准文本从而生成特定样式的标准。本发明专利技术通过定义数据模式规范并自动验证标准的记录格式,从而改变了现有技术中通常所采用的标准的编写和审查方法,增强了标准的交换和应用能力。

【技术实现步骤摘要】
基于XML的标准结构化编写生成方法
本专利技术涉及文字编辑
,特别涉及一种基于XML的标准结构化编写生成方法。
技术介绍
标准是为了在一定范围内获得最佳次序,经协商一致制定并由公认机构批准,共同使用的和重复使用的一种规范性文件。长期以来,标准主要采用非结构化、非标准格式的文档格式进行编写的,这样会导致标准编写复杂、审查效率低、标引和检索困难。例如,传统的标准通常依靠编写人员采用人工来确定标准的结构及其内容要素,再由标准的审查人员按照相关标准的编写规定来进行人工审查,其工作量大,并且难以保证质量。另外,传统的标准文献是顺序的线性格式文档,用户只能翻页阅读,非结构化的标准不便于信息加工和挖掘,非结构话标准中的信息的深度和粒度不能完全满足用户的需求。标准文献中存在大量的内部交叉引用和外部条款引用,但由传统标准的非结构化,很难挖掘知识元素的显性或隐形关联关系。因此,随着可扩展标记语言(XML)的应用,文档的记录格式逐渐采用XML来编写,如电子公文、交互式电子技术手册(IETM)等。采用XML编写文档时,能够通过定义模式(schema)来规范文档的记录格式,并对其进行自动验证,从而改变文档的编写及审查模式,增强了文档的交换和应用能力。而标准是一种要求高度格式化和规范化的文档,目前还没有专门针对标准的结构化编写和/或生成方法。
技术实现思路
针对上述现有技术中存在的问题,本专利技术的目的在于提供一种基于XML的标准结构化编写生产方法,其通过定义模式(schema)规范并自动验证标准的记录格式,从而改变了现有技术中通常所采用的标准的编写和审查方法,增强了标准的交换和应用能力。本专利技术的技术方案如下:一种基于XML的标准结构化编写生成方法,其包括制定标准能够进行通用的数据模式、编写XML格式的结构化文档、验证结构化文档以及生成特定样式的标准四个阶段,其具体步骤如下:步骤1:分别构建针对标准基本信息、内容信息和表述信息的数据模式,形成相应的数据模式文件,各个所述数据模式文件中分别对标准的结构、元素以及元素的表达方法进行定义,构建标准的结构化模型;所述基本信息至少包括标识子元素、状态子元素和责任子元素,其中所述标识子元素包括标准类型、标准号、分类号以及名称;其中所述分类号中至少包括军用标准分类号、国际标准文献分类号以及中国标准文献分类号;所述名称中至少包括标准名称,所述标准名称至少包括英文名称和中文名称;所述状态子元素中包括阶段;所述责任子元素中包括批准单位、归口单位、至少1个起草单位以及至少1个起草人;所述内容信息包括正文子元素,所述正文子元素包括范围和能够进行逐级嵌套的至少1个章条,所述范围包括规定内容和实用范围;所述表述信息用于对各个数据模式中的数据元素允许的描述方式进行说明;步骤2:基于步骤1中所构建的各数据模式文件形成XML格式的结构化文档,将需要编写的内容,按照步骤1中所构建的各数据模式中所定义的元素,录入到结构化文档的相应部分中,生成相应的XML格式的结构化文档;步骤3:通过XML分析器验证步骤2生成的XML格式的结构化文档是否符合步骤1中的数据模式;步骤4:针对步骤1中各数据模式中的元素,形成样式的转换规则,自动将验证通过的XML格式的结构化文档转换成用户需要的标准的文本,生成特定样式的标准。优选地,所述标准中的元素包括基本元素、内容元素和表述元素。优选地,所述数据模式文件中规范了标准全文包含的基本元素、内容元素和表述元素的描述,所述数据模式文件通过符合W3CXML语法的XSD文件进行定义。优选地,采用XSLT方式对样式进行定义,其将XML源文档转换为XML结果文档或者能够被浏览器识别的其他类型的结果文档。进一步,所述结果文档的类型为HTML和/或XHTML。优选地,XSLT将每个XML元素转换为HTML和/或XHTML元素,同时实现向输出文件添加元素和属性以及从输出文件移除元素和属性,或对元素进行重新排列,执行测试并决定特定元素的显示和/或隐藏。优选地,如果步骤2中所生成的XML格式的结构化文档经过验证符合步骤1中各数据模式,则文档正确,验证通过,进入步骤4;如果步骤2中所生成的XML格式的结构化文档经过验证不符合步骤1中各数据模式,则文档错误,验证不通过,并做出错误提示,转入第2步骤。优选地,所述基本信息还包括说明子元素和参考文献子元素,所述说明子元素中包括标准结构的说明、起草规则说明、与旧版标准的关系、与国际标准的关系、与相关专利的关系和特殊信息说明中至少1种;其中标准结构的说明中包括系列标准和分部分标准,系列标准和分部分标准均无数量上的限制;与旧版标准的关系中包括代替标准号、历次发布版本和与前一版的技术变化,代替标准号与历次发布版本号均无数量上的限制,与前一版的技术变化中进一步还包括简单段落,简单段落无数量上的限制;与国际标准的关系中包括国际标准号、国际标准名称和一致性程度;所述参考文献子元素中还包括列表。优选地,所述标识子元素还包括语言。优选地,所述名称中还包括分部分名称,所述分部分名称中至少包括中文名称和英文名称。优选地,所述状态子元素中还包括密级、版本、发布日期、实施日期、有效性和备案号中的至少1种。优选地,所述责任子元素中还包括提出单位。优选地,所述内容信息还包括附录子元素,所述附录子元素至少包括附录提名和附录性质。优选地,所述正文子元素还包括规范性引用文件、术语和定义以及符号代号和缩略语中至少1个;所述规范性引用文件中至少包括1个引用文件条目,所述引用文件条目包括引用文件号和引用文件名称;所述术语和定义中包括使用说明和术语条目中的至少1种,其中所述术语条目无数量上的限制,所述术语条目至少包括中文名称、英文名称和定义,其中所述定义包括能够进行展开的段;所述符号代号和缩略语中包括符号条目、代号条目和缩略语条目中至少1种;所述符号条目中至少包括符号和符号名称;所述代号条目中至少包括包括代号和代号名称;所述缩略语条目中至少包括缩略语和缩略语名称。进一步地,所述术语条目还包括同义词、示例和注中至少1中;其中示例和注中进一步包括段,所述段能够进行展开。更进一步地,所述符号条目中还包括符号说明,所述符号说明包括能够进行展开的段;所述代号条目中还包括代号说明,所述代号说明中包括能够进行展开的段;所述缩略语名称中还包括缩略语说明,缩略语说明包括能够展开的段。与现有技术相比,本专利技术的有益效果如下:本专利技术的基于XML的标准结构化编写生产方法,其通过定义模式(schema)规范并自动验证标准的记录格式,从而改变了现有技术中通常所采用的标准的编写和审查方法,增强了标准的交换和应用能力。附图说明以下结合附图对本专利技术进行详细描述。图1是根据本专利技术的基于XML的标准结构化编写生成方法的流程图。图2是根据本专利技术的基于XML的标准结构化编写生成方法中的针对标准所制定的数据模式结构图。图3是针对如图2所示的标准包含的基本信息而制定的数据模式结构图。图4是针对如图2所示的标准包含的内容信息而制定的数据模式结构图。图5是针对如图2所示的标准包含的表述信息而制定的数据模式结构图。具体实施方式以下将参考附图详细说明本专利技术的示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面本文档来自技高网...
基于XML的标准结构化编写生成方法

【技术保护点】
一种基于XML的标准结构化编写生成方法,其特征在于:包括以下步骤:步骤1:分别构建针对标准基本信息、内容信息和表述信息的数据模式,形成相应的数据模式文件,各个所述数据模式文件中分别对标准的结构、元素以及元素的表达方法进行定义,构建标准的结构化模型;所述基本信息至少包括标识子元素、状态子元素和责任子元素,其中所述标识子元素包括标准类型、标准号、分类号以及名称;其中所述分类号中至少包括军用标准分类号、国际标准文献分类号以及中国标准文献分类号;所述名称中至少包括标准名称,所述标准名称至少包括英文名称和中文名称;所述状态子元素中包括阶段;所述责任子元素中包括批准单位、归口单位、至少1个起草单位以及至少1个起草人;所述内容信息包括正文子元素,所述正文子元素包括范围和能够进行逐级嵌套的至少1个章条,所述范围包括规定内容和实用范围;所述表述信息用于对各个数据模式中的数据元素允许的描述方式进行说明;步骤2:基于步骤1中所构建的各数据模式文件形成的XML格式的结构化文档,将需要编写的内容,按照步骤1中所构建的各数据模式中所定义的元素,录入到结构化文档的相应部分中,生成相应的XML格式的结构化文档;步骤3:通过XML分析器验证步骤2生成的XML格式的结构化文档是否符合步骤1中的数据模式;步骤4:针对步骤1中各数据模式中的元素,形成样式的转换规则,自动将验证通过的XML格式的结构化文档转换成用户需要的的标准的文本,生成特定样式的标准。...

【技术特征摘要】
1.一种基于XML的标准结构化编写生成方法,其特征在于:包括以下步骤:步骤1:分别构建针对标准基本信息、内容信息和表述信息的数据模式,形成相应的数据模式文件,各个所述数据模式文件中分别对标准的结构、元素以及元素的表达方法进行定义,构建标准的结构化模型;所述基本信息至少包括标识子元素、状态子元素和责任子元素,其中所述标识子元素包括标准类型、标准号、分类号以及名称;其中所述分类号中至少包括军用标准分类号、国际标准文献分类号以及中国标准文献分类号;所述名称中至少包括标准名称,所述标准名称至少包括英文名称和中文名称;所述状态子元素中包括阶段;所述责任子元素中包括批准单位、归口单位、至少1个起草单位以及至少1个起草人;所述内容信息包括正文子元素,所述正文子元素包括范围和能够进行逐级嵌套的至少1个章条,所述范围包括规定内容和实用范围;所述表述信息用于对各个数据模式中的数据元素允许的描述方式进行说明;步骤2:基于步骤1中所构建的各数据模式文件形成的XML格式的结构化文档,将需要编写的内容,按照步骤1中所构建的各数据模式中所定义的元素,录入到结构化文档的相应部分中,生成相应的XML格式的结构化文档;步骤3:通过XML分析器验证步骤2生成的XML格式的结构化文档是否符合步骤1中的数据模式;步骤4:针对步骤1中各数据模式中的元素,形成样式的转换规则,自动将验证通过的XML格式的结构化文档转换成用户需要的的标准的文本,生成特定样式的标准。2.如权利要求1所述的基于XML的标准结构化编写生成方法,其特征在于:所述标准中的元素包括基本元素、内容元素和表述元素。3.如权利要求1所述的基于XML的标准结构化编写生成方法,其特征在于:所述数据模式文件中规范了标准全文包含的基本元素、内容元素和表述元素的描述,所述数据模式文件通过符合W3CXML语法的XSD文件进行定义。4.如权利要求1所述的基于XML的标准结构化编写生成方法,其特征在于:采用XSLT方式对样式进行定义,其将XML源文档转换为XML结果文档或者能够被浏览器识别的其他类型的结果文档。5.如权利要求4所述的基于XML的标准结构化编写生成方法,其特征在于:所述结果文档的类型为HTML和/或XHTML。6.如权利要求5所述的基于XML的标准结构化编写生成方法,其特征在于:XSLT将每个XML元素转换为HTML和/或XHTML元素,同时实现向输出文件添加元素和属性以及从输出文件移除元素和属性,或对元素进行重新排列,执行测试并决定特定元素的显示和/或隐藏。7.如权利要求1所述的基于XML的标准结构化编写生成方法,其特征在于:如果步骤2中所生成的...

【专利技术属性】
技术研发人员:曹平高瑾宇陈润杨文宏
申请(专利权)人:中国航空综合技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1