一种基于结构化数据模型的标准信息分析方法技术

技术编号：14165516 阅读：58 留言：0更新日期：2016-12-12 12:53

本发明专利技术提出一种基于结构化数据模型的标准信息分析方法，包括定义结构化标准文本，确定元数据模型XSD；利用页面文本编辑器编辑结构化标准文本；构建标准语义标签库，获取结构化标准文本在对应语义标签库中的位置，并设置占位符；建立标准结构关系库；根据表头信息与标准规范的参照关系，构建参照关系库；资源定位RDF文档，并以规范的目录结构进行存储。本方法在标准内容细粒度管理的基础上，实现了标准元素的细粒度定位，方便检索利用，在标准特性调整时，对于供用电、工交运输等反应灵敏的公用事业及时自动下发，调整服务规范有其现实的意义和潜在巨大的市场空间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种信息分析方法，具体涉及一种基于结构化数据模型的标准信息分析方法。
技术介绍
目前面向电力系统的标准管理、知识处理等都采用手工方式居多，标准体系的管理处于初级信息化应用水平上，标准文本的管理和使用也多是采用PDF、Word等非结构化文本来管理，而且管理成本高昂，因此开发、开放程度不高，国内外均存在相应的问题，有必要针对该问题提出相应的高效率管理与应用方法。目前国内外应用结构化文本，结合可视化技术对标准的管理和推广应用的专利居于空白状态。授权专利CN102646125B“一种结构化数字内容析取与重组方法”中，提出了包括将数字化出版的备选内容存储在以可扩展标记语言(XML)格式为代表的非结构化数据存储器内；将所述的数据存储器内的信息单元，依据结构化数字内容析取与重组的标准定义的析取信息单元的标签进行格式化，形成信息主体的主题块；使用以XML为载体的映射将所述的主题块之间进行关联，并在映射的作用下，将所述的分散的主题块重组为具备逻辑关系的结构化文档；对所述的结构化文档通过可扩展样式语言(XSL)及可扩展样式语言转换(XSLT)根据出版的需求进行样式的渲染，生成各种XML可转换形成的目标出版格式。采用本专利技术，能适应未来出版物内容承载形式多元化，展示形式和终端多样化的特点；但是针对结合可视化技术对标准的管理和推广应用方面的研究仍为提出建设性合理化方案和具有借鉴性的创新。
技术实现思路
为弥补上述空白，本专利技术提出一种基于结构化数据模型的标准文本知识分析方法，支持电力行业中各类参考模型，对描述业务领域的基础数据实现结构化，尤其是智能电网标准体系的相...
一种基于结构化数据模型的标准信息分析方法

【技术保护点】
一种基于结构化数据模型的标准信息分析方法，其特征在于，所述方法包括：S1定义结构化标准文本，确定元数据模型XSD；S2利用页面文本编辑器编辑结构化标准文本；S3获取结构化标准文本在对应规范术语库中的位置，并设置占位符，构建标准语义标签库；S4建立标准结构关系库，并根据表头信息与标准规范的参照关系，构建参照关系库；S5资源定位RDF文档，并以规范的目录结构进行存储。

【技术特征摘要】
1.一种基于结构化数据模型的标准信息分析方法，其特征在于，所述方法包括：S1定义结构化标准文本，确定元数据模型XSD；S2利用页面文本编辑器编辑结构化标准文本；S3获取结构化标准文本在对应规范术语库中的位置，并设置占位符，构建标准语义标签库；S4建立标准结构关系库，并根据表头信息与标准规范的参照关系，构建参照关系库；S5资源定位RDF文档，并以规范的目录结构进行存储。2.如权利要求1所述的方法，其特征在于，所述步骤S1具体包括，定义XML Schema文件为结构化标准文本，将该文本扫描并由标准头信息录入管理器，上载至标准头信息录入页面，输出元数据模型XSD。3.如权利要求1所述的方法，其特征在于，所述步骤S2的结构化标准文本采用JavaScript编辑器显示于数据编辑页面上，用于完成结构化标准文本信息的录入和修改。4.如权利要求1所述的方法，其特征在于，所述步骤S3构建语义标签库包括，遍历和提取业务描述领域的关键词信息，生成包含一级术语和二级术语在内的语义标签；根据XML Schema规范，以树状形式将语义标签写入语义标签库；在构建语义标签库之前，若系统自身已包含该业务描述领域的规范术语库，则建立语义标签与规范术语之间的映射关系，并使用RDF模型对该映射关系进行描述；若所述规范术语与语义标签仅语义相同，则将规范术语库中的规范术语定义为语义标签的备选标签，并作为元数据的组成部分。5.如权利要求1所述的方法，其特征在于，所述步骤S4中，建立标准结构关系库包括以下步骤：S401提取文本按照章节编号和段落起始顺序排序并编号；S402按照元数...

【专利技术属性】
技术研发人员：冯泽健，白晓民，盛万兴，崔全胜，王立岩，董伟杰，刘永梅，李建祥，
申请(专利权)人：中国电力科学研究院，国家电网公司，国网山东省电力公司，国网山东省电力公司电力科学研究院，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人