一种基于多媒体数据转换数据存储格式的方法技术

技术编号:10134392 阅读:129 留言:0更新日期:2014-06-16 13:10
本发明专利技术公开了一种基于多媒体数据识别转换数据存储格式的方法,所述方法包括:接收基于多媒体数据下的非结构化数据的输入;判断所述非结构化数据中的数据格式;若判断识别出非结构化数据中的数据格式为初始化普通文本,则对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流;若判断识别出非结构化数据中的数据格式为虚拟实现建模语言VRML数据,则对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换;将整理成的XML流和/或者经过X3D转换器转换后的VRML数据存入关系数据库。通过实施本发明专利技术,通过将非结构化的数据经过转换成在关系数据库中能够表示的数据,使得采用关系数据库的应用程序能够利用这些数据。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于多媒体数据识别转换数据存储格式的方法,所述方法包括:接收基于多媒体数据下的非结构化数据的输入;判断所述非结构化数据中的数据格式;若判断识别出非结构化数据中的数据格式为初始化普通文本,则对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流;若判断识别出非结构化数据中的数据格式为虚拟实现建模语言VRML数据,则对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换;将整理成的XML流和/或者经过X3D转换器转换后的VRML数据存入关系数据库。通过实施本专利技术,通过将非结构化的数据经过转换成在关系数据库中能够表示的数据,使得采用关系数据库的应用程序能够利用这些数据。【专利说明】
本专利技术涉及数字家庭
,具体涉及。
技术介绍
目前,大多数信息都是非结构化的,非结构化数据在数字家庭应用中占有绝大多数信息,它有应用范围广、处理难、标准多等特点,非结构化数据也是异构数据的主要形式,是当前数字家庭亟待突破和解决的重大问题之一。数字家庭中的互动多媒体是指能够和用户进行互动的具备文本、图像等信息的数据。这种信息一般都是非结构化的信息,包含文字和图像等信息。然而处理这些非结构化数据并非易事;当前成熟的数据存储技术还是基于关系数据库的,关系数据库具有操作简单规范、数据分析和挖掘和分析也比非结构化数据容易;所以如何将非结构化的多媒体数据转换成结构化存储的关系数据变得非常必要。当前对普通文本转换成关系型数据库有一些方法。这些方法首先将非结构化的数据进行半结构化,然后再对半结构化的数据进一步处理成结构化的符合关系型数据库的数据。在办结构化的阶段可以采用普遍的做法是XML5XML就是一种半结构化的数据存储格式,它能够很好的现在的转储方法针对普通的文本文件已经能够取得不错的效果;但是针对一些图形数据和图像数据的时候并不能很好的支持;图形在数字家庭中在娱乐方面具有很重要的地位,一般采用网格表示;图像在家庭医疗中非常重要,通常伴随着图像特征等数据,这两种数据需要特别的处理,而当前的方法并不能很好的处理这两种数据。
技术实现思路
本专利技术的目的是为数字家庭环境中海量互动应用产生的多媒体数据提供一种转换存储方法,使得这些非结构化数据能够存储在规范的关系数据库中,方便后续应用利用。本专利技术实施例提供了一种基于多媒体数据识别转换数据存储格式的方法,所述方法包括:接收基于多媒体数据下的非结构化数据的输入;判断所述非结构化数据中的数据格式;若判断识别出非结构化数据中的数据格式为初始化普通文本,则对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流;若判断识别出非结构化数据中的数据格式为虚拟实现建模语言VRML数据,则对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换;将整理成的XML流和/或者经过X3D转换器转换后的VRML数据存入关系数据库。所述初始化普通文本是以文本文件TXT保存的文本。所述对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流包括:制作XML模板、输入识别字符和分离字符以及源数据,然后生成XML文件。所述对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换包括:对图形图像数据进行语义上的标注;对标记好的信息进行归类统计、组建逻辑的预处理;节点分类;将这些分好类别处理过的X3D进行格式化,将其格式化成关系数据库中模式、表、表项所需要对应的类型,导入数据库中。所述关系数据库为MS-SQL、或者MySQL。通过实施本专利技术,通过将非结构化的数据经过转换成在关系数据库中能够表示的数据,使得采用关系数据库的应用程序能够利用这些数据^fXML中的元素和关系数据库中的模式进行映射,将相近的元素归纳为同一个类别,对应于关系数据库中的表以及表的列、元组,这样可以利于挖掘多媒体中的关键信息;实例多的元素类型变成了元组多,这样就只需要查询表格就可以得到多媒体的关键特征数据和关键元素。【专利附图】【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术实施例中的基于多媒体数据识别转换数据存储格式的方法流程图;图2是本专利技术实施例中的将文本数据转换成XML文件流程示意图;图3是本专利技术实施例中的将X3D数据转换成关系数据库中的数据的流程示意图;图4是本专利技术实施例中的X3D元素和关系数据库的映射关系示意图;图5是本专利技术实施例中的统计同类元素的流程示意图;图6是本专利技术实施例中的基于多媒体数据转换数据存储格式系统部署结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。一般说来,数字家庭终端不同应用产生的或者是采集生成的数据都是非结构化的,不同的应用其数据设计必然不一样;很多数据并没有为关系数据库做为存储,这为后续的以关系数据库为基础的应用带来了困难。所以有必要对数据进行转换存储。本系统的流程如图1所示,系统接收基于多媒体数据下的非结构化数据的输入;判断所述非结构化数据中的数据格式;若判断识别出非结构化数据中的数据格式为初始化普通文本,则对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流;若判断识别出非结构化数据中的数据格式为虚拟实现建模语言VRML数据,则对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换;将整理成的XML流和/或者经过X3D转换器转换后的VRML数据存入关系数据库。本实施例首先以非结构化数据作为输入,即自动识别获取数据;识别的数据包含初始化的普通文本,例如以TXT保存的文件;或者是VRML (Virtual RealityModeling Language,虚拟现实建模语言)数据,VRML是在虚拟现实的场景模型和三维世界的场景中通用的建模语言。接下来对识别的普通文本和/或VRML数据进行分开处理,普通文本采用XML库整理成XML流,而VRML经过X3D转换器的转换,最后将这些转换后的数据导入到关系数据库中,例如MS-SQL、MySQL等。其中的XML库有很多种选择,可以采用微软的MSXML,也可以采用其他如java语言的一些XML库,XML库已经非常普遍,而且实现的功能也基本相同,所以选取在合适平台下能够进行的即可。X3D是VRML的一个替代技术,它不仅实现了 VRML的全部功能,而且把它封装到一个更为轻型的,可扩展的核心之中。X3D将VRML脚本看作是一个结构化的数据集合,然后将其中的元素映射到XML文档下相应的节点。从而将在VRML描述下的图形图像数据能够在标准的XML文档中处理。本系统将普通文本数据和VRML数据区分对待。如图2所示是将文本数据转换成XML文件。她主要包含三部分内容制作XML模板、输入识别字符和分离字符以及源数据,本文档来自技高网
...

【技术保护点】
一种基于多媒体数据识别转换数据存储格式的方法,其特征在于,所述方法包括:接收基于多媒体数据下的非结构化数据的输入;判断所述非结构化数据中的数据格式;若判断识别出非结构化数据中的数据格式为初始化普通文本,则对获取的初始化普通文本采用可扩展标记语言XML库整理成XML流;若判断识别出非结构化数据中的数据格式为虚拟实现建模语言VRML数据,则对获取的VRML数据采用可扩展三维语言X3D转换器进行数据格式的转换;将整理成的XML流和/或者经过X3D转换器转换后的VRML数据存入关系数据库。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘海亮杨艾琳罗笑南苏航曾坤王炫盛
申请(专利权)人:中山大学深圳研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1