一种基于语义的XBRL数据到OWL数据的转换方法技术

技术编号:15329838 阅读:71 留言:0更新日期:2017-05-16 13:25
本发明专利技术公开了一种基于语义的XBRL数据到OWL数据的转换方法,所述转换方法包括:基于语义网技术构建XBRL财务报告和事实数据语义元模型、解析XBRL分类标准构建其XML信息集、解析XBRL实例文档构建实例文档信息集、设计XBRL分类标准到OWL本体转换算法、设计XBRL实例文档到OWL实体的转换算法。本发明专利技术能在语义层面实现数据格式的转换,解决了XBRL语义异构的映射问题。

A semantic based method for converting XBRL data to OWL data

The invention discloses a conversion based on semantic XBRL data to OWL data conversion method, the method comprises: a conversion algorithm of semantic web technology to construct the XBRL financial reporting and data semantic meta model, analytic XBRL classification standard to construct the XML information collection and analysis of the XBRL instance document build instance document information set, XBRL classification the standard OWL ontology conversion algorithm, design the XBRL instance document to entities based on the OWL. The invention can realize the conversion of data format at the semantic level, and solves the mapping problem of XBRL semantic isomerism.

【技术实现步骤摘要】
一种基于语义的XBRL数据到OWL数据的转换方法
本专利技术属于XBRL技术和会计信息化
,尤其涉及一种基于语义的XBRL数据到OWL数据的转换方法。
技术介绍
可扩展商业报告语言(eXtensibleBusinessReportingLanguage,XBRL)是XML标记语言在商业报告领域的应用,自1998年诞生以来经过了不断的发展与完善,其技术体系已经趋于稳定,并成为了商业报告领域的技术标准。XBRL继承了XML的灵活性、可扩展性和跨平台性等优点,充分利用了XML命名空间、SCHEMA、XLink和XPath等技术,实现了对财务报告概念、概念间的关系以及事实数据的标记和建模。XBRL采用一种扁平的数据结构,在Schema文件中定义财务报告的概念,在链接库文件中定义概念间关系,形成了财务报告领域的“业务辞典”,即XBRL财务报告分类标准。随着XBRL技术在全球范围内的广泛应用,XBRL数据量也在急速增长。包括中国、美国在内的多个国家已颁布和实施了各自的XBRL分类标准和XBRL财务报告报送,基于此的XBRL数据分析往往会面临处理异构XBRL分类标准产生的XBRL实例文档的问题。导致XBRL数据异构的主要原因如下:一,世界各地在制定分类标准的时候,所依据的会计制度和政策不同,采用的技术路线和模型架构不同,导致依照各地不同分类标准制定的实例文档之间并不具备很强的互操作性;二,同一地区的分类标准也存在新旧版本的更替问题,会计概念或关系的变更也会影响不同会计期间财务报告的互操作性;三,XBRL技术强大的可扩展性虽然在极大程度上满足了财务报告编制者全面披露企业财务信息的需求,但不当和过度的扩展会严重限制XBRL数据的可比较性和互操作性。为了从语义层面实现跨分类标准的数据分析,通常需要建立不同分类标准之间的映射关系。如果有N个不同的分类标准,就需要建立N(N-1)/2个数据转换模板,这无疑大大增加了海量XBRL数据管理和查询的难度。
技术实现思路
本专利技术的目的在于提供一种基于语义的XBRL数据到OWL数据的转换方法,旨在解决现有技术在语义层面不能实现数据格式的转换,需要建立不同分类标准之间的映射关系和需要建立多个数据转换模板,大大增加了海量XBRL数据管理和查询的难度的问题。本专利技术是这样实现的,一种基于语义的XBRL数据到OWL数据的转换方法,所述基于语义的XBRL数据到OWL数据的转换方法包括:(1)基于语义网技术构建XBRL财务报告和事实数据语义元模型:首先利用OWL本体编辑工具将XBRL语义元模型创建成OWL本体;然后将XBRL技术规范的模式文件中定义的数据类型创建成OWL本体形式;(2)解析XBRL分类标准构建其XML信息集:XML信息集是在解析了XBRL分类标准的模式文件和链接库文件之后生成的携带语义信息的XML树模型,用于保证转换过程中语义信息的完整性;(3)解析XBRL实例文档构建实例文档信息集:XML信息集是在解析了XBRL分类标准和实例文档之后生成的XML树模型,在事实数据的属性中融入该元素在XBRL分类标准模式文件中定义时设置的balance属性和periodType属性;(4)设计XBRL分类标准到OWL本体转换算法:首先将XBRL分类标准模式文档中定义的元素转换为OWL类,XBRL分类标准的标签链接库和参考链接库中相应的信息转换为OWL类的标签子元素和注释子元素;然后,从步骤(2)生成的解析后的XBRL分类标准的XML信息集中提取元素和元素间关系,信息集中的元素转换为OWL对应类的个体,信息集中元素间关系转换为OWL个体间的关系,基于步骤(1)生成的语义元模型本体,转换为OWL本体格式;(5)设计XBRL实例文档到OWL实体的转换算法:基于步骤(4)生成的分类标准OWL本体,从步骤(3)生成的解析后XBRL实例文档的XML信息集中提取元素及其上下文信息和计量单位,信息集中的元素引用步骤(4)中对应的OWL个体,通过hasContext对象属性给该OWL个体增加上下文信息,通过hasUnit和hasVAlue数据属性分别给该OWL个体增加计量单位信息和数值信息。进一步,解析XBRL分类标准构建XML信息集算法,具体步骤如下:1)解析XBRL定义链接库文件,判断是否存在弧角色;2)输出linkType、extRole、arcRole等信息的值;3)定义链接弧的from属性指向元素的uri作为输出文件fromPath属性值;4)定义链接弧的to属性指向元素的uri作为输出文件toPath属性值;5)剩余信息进行复制;6)得到链接库信息集后,判别最后一个弧角色是否满足要求。如果满足要求,则算法结束;如果未满足要求,则返回第2)步执行。进一步,解析XBRL实例文档构建XML信息集算法,具体步骤如下:(a)解析XBRL实例文档,判断是否读取到实例值;(b)通过字符串的匹配,将读取到的信息复制输出;(c)在分类标准中找到当前元素的balance和periodType属性,作为该元素的属性输出;(d)剩余信息进行复制输出;(e)得到实例文档信息集后,判别是否存在实例值。如果满足要求,则算法结束;如果未满足要求,则返回第(b)步执行。进一步,XBRL分类标准到OWL本体转换算法,具体步骤如下:(一)输入XBRL分类标准文件,提取和解析分类标准模式文件、标签链接库和参考链接库文件;(二)判断是否是element节点,如果满足要求将模式文件定义的元素转换为OWL类,元素名即类名;(三)判断是否具有标准标签和参考信息,然后通过ID匹配标签链接库和参考链接库中的信息,转换成<rdfs:labelxml:lang="">和<rdfs:comment>两种子元素;(四)将element节点type、periodType、balance、substitutionGroup属性转换为相应的owl:subClassOf元素的rdf:resoure属性值;再判断是否有abstracts属性,若属性值为false,则生成Concept类的子类,若属性值为true,则生成AbstractsConcept类的子类,(五)提取和解析计算链接库、定义链接库、列报链接库文件,按照解析XBRL实例文档构建XML信息集算法,对文件进行解析形成XML信息集;(六)依次读取XML信息集中的元素,提取元素和元素间关系,信息集中的元素转换为OWL对应类的个体,信息集中元素间关系转换为OWL个体间的关系,基于第(1)步生成的语义元模型本体,转换为OWL本体格式。进一步,如XBRL实例文档到OWL实体转换算法,具体包括:(A)输入分类标准解析后生成的OWL文件;(B)输入XBRL实例文档,按照解析XBRL分类标准构建XML信息集算法解析XBRL实例文档,生成信息集;(C)依次读取信息集中的元素,若当前元素在OWL本体中有对应的类,则转换成该OWL类对应的个体,该元素的contextRef属性、unitRef属性和decimal属性分别转换为其对应OWL个体的hasContext对象属性、hasUnit数据属性和hasDecimal数据属性,该元素值转换为其对应OWL个体的hasFactvalue数据属性的值;否则指本文档来自技高网
...
一种基于语义的XBRL数据到OWL数据的转换方法

【技术保护点】
一种基于语义的XBRL数据到OWL数据的转换方法,其特征在于,所述基于语义的XBRL数据到OWL数据的转换方法包括:(1)基于语义网技术构建XBRL财务报告和事实数据语义元模型:首先利用OWL本体编辑工具将XBRL语义元模型创建成OWL本体;然后将XBRL技术规范的模式文件中定义的数据类型创建成OWL本体形式;(2)解析XBRL分类标准构建其XML信息集:XML信息集是在解析了XBRL分类标准的模式文件和链接库文件之后生成的携带语义信息的XML树模型,用于保证转换过程中语义信息的完整性;(3)解析XBRL实例文档构建实例文档信息集: XML信息集是在解析了XBRL分类标准和实例文档之后生成的XML树模型,在事实数据的属性中融入该元素在XBRL分类标准模式文件中定义时设置的balance属性和periodType属性;(4)设计XBRL分类标准到OWL本体转换算法:首先将XBRL分类标准模式文档中定义的元素转换为OWL类,XBRL分类标准的标签链接库和参考链接库中相应的信息转换为OWL类的标签子元素和注释子元素;然后,从步骤(2)生成的解析后的XBRL分类标准的XML信息集中提取元素和元素间关系,信息集中的元素转换为OWL对应类的个体,信息集中元素间关系转换为OWL个体间的关系,基于步骤(1)生成的语义元模型本体,转换为OWL本体格式;(5)设计XBRL实例文档到OWL实体的转换算法:基于步骤(4)生成的分类标准OWL本体,从步骤(3)生成的解析后XBRL实例文档的XML信息集中提取元素及其上下文信息和计量单位,信息集中的元素引用步骤(4)中对应的OWL个体,通过hasContext对象属性给该OWL个体增加上下文信息,通过hasUnit和hasVAlue数据属性分别给该OWL个体增加计量单位信息和数值信息。...

【技术特征摘要】
1.一种基于语义的XBRL数据到OWL数据的转换方法,其特征在于,所述基于语义的XBRL数据到OWL数据的转换方法包括:(1)基于语义网技术构建XBRL财务报告和事实数据语义元模型:首先利用OWL本体编辑工具将XBRL语义元模型创建成OWL本体;然后将XBRL技术规范的模式文件中定义的数据类型创建成OWL本体形式;(2)解析XBRL分类标准构建其XML信息集:XML信息集是在解析了XBRL分类标准的模式文件和链接库文件之后生成的携带语义信息的XML树模型,用于保证转换过程中语义信息的完整性;(3)解析XBRL实例文档构建实例文档信息集:XML信息集是在解析了XBRL分类标准和实例文档之后生成的XML树模型,在事实数据的属性中融入该元素在XBRL分类标准模式文件中定义时设置的balance属性和periodType属性;(4)设计XBRL分类标准到OWL本体转换算法:首先将XBRL分类标准模式文档中定义的元素转换为OWL类,XBRL分类标准的标签链接库和参考链接库中相应的信息转换为OWL类的标签子元素和注释子元素;然后,从步骤(2)生成的解析后的XBRL分类标准的XML信息集中提取元素和元素间关系,信息集中的元素转换为OWL对应类的个体,信息集中元素间关系转换为OWL个体间的关系,基于步骤(1)生成的语义元模型本体,转换为OWL本体格式;(5)设计XBRL实例文档到OWL实体的转换算法:基于步骤(4)生成的分类标准OWL本体,从步骤(3)生成的解析后XBRL实例文档的XML信息集中提取元素及其上下文信息和计量单位,信息集中的元素引用步骤(4)中对应的OWL个体,通过hasContext对象属性给该OWL个体增加上下文信息,通过hasUnit和hasVAlue数据属性分别给该OWL个体增加计量单位信息和数值信息。2.如权利要求1所述的基于语义的XBRL数据到OWL数据的转换方法,其特征在于,解析XBRL分类标准构建XML信息集算法,具体步骤如下:1)解析XBRL定义链接库文件,判断是否存在弧角色;2)输出linkType、extRole、arcRole等信息的值;3)定义链接弧的from属性指向元素的uri作为输出文件fromPath属性值;4)定义链接弧的to属性指向元素的uri作为输出文件toPath属性值;5)剩余信息进行复制;6)得到链接库信息集后,判别最后一个弧角色是否满足要求;如果满足要求,则算法结束;如果未满足要求,则返回第2)步执行。3.如权利要求1所述的基于语义的XBRL数据到OWL数据的转换方法,其特征在于,解析XBRL实例文档构建XML信息集算法,具体步骤如下:...

【专利技术属性】
技术研发人员:黄敏缪青海肖应伟王文礼王颖
申请(专利权)人:中国科学院大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1