当前位置: 首页 > 专利查询>东南大学专利>正文

支持共享共治的内容元数据标识及应用方法技术

技术编号:14509854 阅读:49 留言:0更新日期:2017-02-01 02:27
本发明专利技术公开了一种支持共享共治的内容元数据标识方法(简称MDCCSG方法)及应用方法,该标识方法针对大数据和泛媒体环境下的内容大数据共享共治需求提出,适用于对各种品类的内容资源进行统一标识,与之配套的应用方法可有效支持内容大数据的高效共享和科学治理等。MDCCSG方法包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义等,该标识方法既能详尽描述内容的丰富语义信息,又具有内嵌的(built‑in)内容可信认证与安全保障能力;基于MDCCSG标识可开发各种内容共享共治应用,能够有效支持内容大数据的高效聚合与分发、个性化主动服务、语义深度分析、认证注册管理、依法溯源追责等。

【技术实现步骤摘要】

本专利技术涉及一种支持共享共治的内容元数据标识及应用方法,可提升大数据和泛媒体环境下的内容大数据高效共享能力和科学治理水平,属于互联网与信息

技术介绍
随着互联网技术与应用的飞速发展以及网络用户的快速增长,以泛媒体化和海量化等为特征的内容分发与共享,正成为互联网应用发展的主旋律,网络内容的大数据化趋势日益凸显。发布渠道的便捷性与泛在性,促使网络中的内容大数据越来越呈现出复杂异构、良莠不齐和混乱失序等特征,处理起来异常困难。如何应对泛媒体化和内容大数据化所带来的严峻挑战,世界各国都在积极探索有效的实现技术。在乌镇召开的第二届世界互联网大会提出“互联互通、共享共治”的发展理念,强调通过共享共治推进全球互联网体系变革。互联网共享共治的核心目标是网络内容大数据的共享共治。互联网中的内容大数据,来源广泛且更新频繁,并具有非结构化(或半结构化)和高度异构等特点,因此共享共治内容大数据的关键在于内容元数据(Metadata)标识方法创新。传统互联网主要采用统一资源定位符URL来标识网络中的资源,但它通常只能表示内容资源的位置,难以描述内容的丰富语义信息,由此带来互联网内容资源难找、难管、失序等弊端。其他的一些内容标识方法,如数字对象标识符DOI,以及信息中心网络研究领域所提出的内容标识方法,包括层次化内容标识方法(如TRIAD、CCN和NDN)、扁平化内容标识方法(如DONA、PSIRP和NetInf)和基于属性的内容标识方法(如CBCB)等,总的来说对内容的语义和管理信息描述能力普遍较弱,难以满足网络内容大数据的共享共治需求。另外,国际上近年来影响较大的是都柏林核心元数据集(DublinCore),它已经发展成一种与统一资源标识URI关联的内容元数据标准,但都柏林核心元数据集的15个核心元数据,根源于图书馆的图书资料描述方式,与内容大数据共享共治的要求相去甚远。因此,亟需专利技术一种可在大数据和泛媒体环境下,支持互联网内容大数据共享共治的创新型内容元数据标识方法,并提出与之配套的内容大数据高效共享和科学治理应用方法。
技术实现思路
专利技术目的:针对现有技术中存在的问题与不足,本专利技术提供一种支持共享共治的内容元数据标识及应用方法,该标识方法适用于对各种品类的内容资源进行统一标识,既能详尽描述内容的丰富语义信息,又具有内嵌的(built-in)内容可信认证与安全保障能力,应用该标识方法可开发各种内容共享共治应用,支持内容大数据的高效聚合与分发、个性化主动服务、语义深度分析、认证注册管理、依法溯源追责等,大幅提升内容共享共治的性能和水平。技术方案:一种支持共享共治的内容元数据标识及应用方法,与已有方法不同的是,该标识方法主要针对大数据和泛媒体环境下的内容大数据共享共治需求提出,能有效弥补各种已有内容元数据标识方法在内容丰富语义描述、内容高效分发与共享、内容可信认证与安全保障、网络内容大数据科学治理等方面所存在的不足。该标识方法借助于一个统一的内容元数据描述框架和规约方法,把内容的提供者、内容的使用者和内容共享的管理者等紧密关联起来,形成一套以内容为中心的内容元数据创新标识体系,本专利技术称之为MDCCSG(MetadataforCyberContentSharingandGovernance)方法。与之配套的应用方法可用于构建各种内容共享共治应用,实现内容大数据的高效共享和科学治理等。本专利技术提出的支持共享共治的内容元数据标识方法主要包括三个部分,即:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义等。具体如下:1)内容元数据的统一描述框架。MDCCSG方法充分考虑大数据和泛媒体环境下的内容大数据共享共治需求,采用一个统一的描述框架对内容元数据进行标识,该描述框架为每一份待标识的内容资源生成一个具有统一格式的内容元数据标识(称为MDCCSG标识),它包括两个部分:MDCCSG标识短码和MDCCSG属性信息。其中,MDCCSG标识短码位于整个MDCCSG标识的前部,它的标准长度为32字节(Byte),由多个域(field)组成,这些域存放与内容有关的若干关键信息描述码(称为基础短码)。此外,MDCCSG标识短码还可以带有扩展部分,扩展部分是长度为16字节整数倍(即16B×n,n=0,1,2,3,…)的扩展信息描述码(称为扩展短码),用来存放基础短码之外的扩展域。基础短码和扩展短码合称为MDCCSG标识短码。MDCCSG属性信息紧接在MDCCSG标识短码之后,它包含多个元数据集合单元(MetadataSetUnit,MDSU),每个元数据集合单元包含多个元数据元素(MetadataElement,MDE),每个元数据元素(MDE)描述与内容有关的一方面属性信息。MDCCSG属性信息部分有两个必选的关键元数据集合单元:内容描述信息集合单元(DISU)和内容管理信息集合单元(MISU)。其中,DISU侧重描述内容的基本属性及语义信息等;MISU侧重描述网络环境中与内容管理有关的重要属性信息。2)内容元数据的统一规约方法。MDCCSG方法以内容元数据的统一描述框架为基础,尤其注重内容元数据标识在编码方式上的高效性和灵活性,以及在规约形式上的严谨性和统一性,包括:(1)高效灵活的内容元数据编码方式。为提高网络环境中内容元数据标识的分发效率和处理效率,MDCCSG方法不使用一般标识技术常采用的基于XML的编码方式,而是针对MDCCSG标识短码和MDCCSG属性信息两个部分,分别采用不同的编码方式。在MDCCSG标识短码部分,充分利用32字节来定义主要以位(bit)为单位的内容元数据信息,通过二进制整数描述多个关键域,尤其侧重对内容语义和安全信息等的描述,便于对内容使用者进行快速导引、过滤、匹配、推荐等服务。在MDCCSG属性信息部分,通过元数据集合单元(MDSU)分类归集多个元数据元素(MDE),并且每个元数据集合单元和每个元数据元素,都采用统一的编码格式,指示出必要的解析辅助信息,使编码简洁紧凑、易于解析,尽量减少存储空间开销。同时,还通过预留、按需扩展等方式,确保MDCCSG标识的灵活可扩展性。(2)严谨统一的内容元数据规约形式。MDCCSG方法可对所有品类的内容资源进行标识,所得到的MDCCSG标识都采用统一的格式标准,可以有效地归集聚合,形成网络内容大数据的MDCCSG标识空间。并且,在每一个MDCCSG标识的内部,对具有共性的元数据信息的规约形式进行归类提炼,确保使用尽可能少的类别,并且对这些类别进行严谨、规范地定义,使每种类别遵循一致的形式和描述体例。MDCCSG标识的主要规约形式分为四种:标识短码中的域,用以位(bit)为单位的二进制整数进行规约;元数据集合单元(MDSU)头部,长度为5~8个字节,主要规约类型编号、元数据元素个数、元数据元素总长度、元数据元素速配信息等;元数据元素(MDE)头部,长度为3~6个字节,主要规约类型编号、成员个数、MDE净荷长度等;元数据元素(MDE)的净荷,占多个字节,描述对应元数据元素的具体取值。MDCCSG属性信息部分的头部,也采用与MDSU头部类似的规约形式。3)核心MDCCSG标识要素定义。MDCCSG方法兼顾内容提供者、内容使用者和内容共享本文档来自技高网
...
支持共享共治的内容元数据标识及应用方法

【技术保护点】
一种支持共享共治的内容元数据标识方法,简称MDCCSG方法,其特征在于:针对大数据和泛媒体环境下的内容大数据共享共治需求提出,包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义,具体如下:(1)内容元数据的统一描述框架:该描述框架为每一份待标识的内容资源生成一个具有统一格式的内容元数据标识,称为MDCCSG标识,它包括两个部分:MDCCSG标识短码和MDCCSG属性信息;(2)内容元数据的统一规约方法:针对MDCCSG标识短码和MDCCSG属性信息两个部分,分别采用不同的编码规约方式;在MDCCSG标识短码部分,利用32字节来定义主要以位(bit)为单位的内容元数据信息,通过二进制整数描述多个关键域,侧重对内容语义和安全信息的描述;在MDCCSG属性信息部分,通过元数据集合单元分类归集多个元数据元素;还通过预留、按需扩展方式,确保MDCCSG标识的灵活可扩展性;(3)核心MDCCSG标识要素定义:选出多个核心的内容元数据标识要素,这些标识要素涵盖内容的语义描述信息、内容可信认证与安全保障信息,同时创设反映内容品质属性的安全能级标识要素,并能够支持“双签名机制”和“多级认证注册 + 溯源追责”功能。...

【技术特征摘要】
1.一种支持共享共治的内容元数据标识方法,简称MDCCSG方法,其特征在于:针对大数据和泛媒体环境下的内容大数据共享共治需求提出,包括三个部分:内容元数据的统一描述框架、内容元数据的统一规约方法、核心MDCCSG标识要素定义,具体如下:(1)内容元数据的统一描述框架:该描述框架为每一份待标识的内容资源生成一个具有统一格式的内容元数据标识,称为MDCCSG标识,它包括两个部分:MDCCSG标识短码和MDCCSG属性信息;(2)内容元数据的统一规约方法:针对MDCCSG标识短码和MDCCSG属性信息两个部分,分别采用不同的编码规约方式;在MDCCSG标识短码部分,利用32字节来定义主要以位(bit)为单位的内容元数据信息,通过二进制整数描述多个关键域,侧重对内容语义和安全信息的描述;在MDCCSG属性信息部分,通过元数据集合单元分类归集多个元数据元素;还通过预留、按需扩展方式,确保MDCCSG标识的灵活可扩展性;(3)核心MDCCSG标识要素定义:选出多个核心的内容元数据标识要素,这些标识要素涵盖内容的语义描述信息、内容可信认证与安全保障信息,同时创设反映内容品质属性的安全能级标识要素,并能够支持“双签名机制”和“多级认证注册+溯源追责”功能。2.如权利要求1所述的支持共享共治的内容元数据标识方法,其特征在于:MDCCSG标识短码位于整个MDCCSG标识的前部,它的标准长度为32字节(Byte),由多个域(field)组成,这些域存放与内容有关的若干关键信息描述码,称为基础短码;此外,MDCCSG标识短码还可以带有扩展部分,扩展部分是长度为16字节整数倍的扩展信息描述码,称为扩展短码,用来存放基础短码之外的扩展域;基础短码和扩展短码合称为MDCCSG标识短码。3.如权利要求1所述的支持共享共治的内容元数据标识方法,其特征在于:MDCCSG属性信息紧接在MDCCSG标识短码之后,它包含多个元数据集合单元(MetadataSetUnit,MDSU),每个元数据集合单元包含多个元数据元素(MetadataElement,MDE),每个元数据元素(MDE)描述与内容有关的一方面属性信息,MDCCSG属性信息部分包含两个必选的关键元数据集合单元:内容描述信息集合单元(DISU)和内容管理信息集合单元(MISU);其中,DISU侧重描述内容的基本属性及语义信息;MISU侧重描述网络环境中与内容管理有关的重要属性信息。4.如权利要求1所述的支持共享共治的内容元数据标识方法,其特征在于:MDCCSG标识的主要规约形式分为四种:标识短码中的域,用以位(bit)为单位的二进制整数进行规约;元数据集合单元(MDSU)头部,长度为5~8个字节,主要规约类型编号、元数据元素个数、元数据元素总长度、元数据元素速配信息;元数据元素(MDE)头部,长度为3~6个字节,主要规约类型编号、成员个数、MDE净荷长度;元数据元素(MDE)的净荷,占多个字节,描述对应元数据元素的具体取值;而MDCCSG属性信息部分的头部,采用与MDSU头部类似的规约形式。5.如权利要求1所述的支持共享共治的内容元数据标识方法,其特征在于:核心MDCCSG标识要素定义具体包括:(1)MDCCSG标识短码部分的核心标识要素:该部分的第1个关键标识要素是版本,占3bits,用来描述MDCCSG标识的版本号;MDCCSG标识短码部分的核心标识要素还包括:媒体类型、优先级别、标志、解码规则、内容来源、一级类别、二级类别、内容话题、正文类型、版权与原创、安全能级码、秒级时间戳、毫秒级时间戳、顺序号、校验和;此外,在顺序号之后、校验和之前的部分,还保留了6个字节;(2)MDCCSG属性信息部分的核心标识要素:该部分采用元数据集合单元(MDSU)对MDCCSG标识要素进行分类归集,主要有三种MDSU:内容描述信息集合单元(DISU)、内容管理信息集合单元(MISU)和内容扩展信息集合单元...

【专利技术属性】
技术研发人员:杨鹏李幼平尹浩吕勇强
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1