一种多媒体数据集中处理系统技术方案

技术编号:4268450 阅读:229 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种多媒体数据集中处理系统,包括:资源数据库,包括视音频数据库、XML对象数据库及文本语音关联模块;业务支撑模块,用于生成对所述资源数据库进行处理的功能引擎,所述功能引擎包括检索引擎,用于依据用户提交的搜索关键词,在所述XML对象数据库中查找匹配的文本信息,并依据所述文本关联的语音特征量和时码提取对应的视音频信息;业务服务模块,用于依据节目制作的需求,与资源数据库进行交互,以及,配置相应功能引擎的执行任务;业务应用模块,用于为用户提供最终的业务展现。本发明专利技术可以有效解决新媒体内容生产过程中内容存储管理与内容快速生产制作无缝结合的问题。

【技术实现步骤摘要】

本专利技术涉及多媒体数据处理的
,特别是涉及一种多媒体数据集中处理系 统。
技术介绍
随着流媒体技术在互联网的广泛应用,以及各电视台、电台、网站、甚至电信运营 商开始基于IP网络采用流媒体技术进行内容的多渠道发布,如手机电视、IPTV、移动电视 等。同时,视音频素材的来源也从原来传统媒体主要由专业人员、设备进行素材采集到现在 各种来源,如普通用户上传等,素材来源和发布都呈现多元化发展,同时素材格式除传统常 用视音频格式外,也呈现出新媒体特点,比如一些常用的网络格式。此外,图片、文本甚至 html网页也成为需要管理的新媒体内容。然而在传统的多媒体数据处理系统中,对于多媒体节目的制作通常是采用固定的 标准对视音频文件进行编目、存储和管理,对于新媒体内容,由于传统存储采用的是非对象 管理模式,没有彻底屏蔽文件格式,往往无法识别或处理,无法快捷地与新媒体内容生产过 程融合。
技术实现思路
本专利技术所要解决的技术问题是提供一种多媒体数据集中处理系统,以有效解决新 媒体内容生产过程中内容存储管理与内容快速生产制作无缝结合的问题。为了解决上述技术问题,本专利技术实施例公开了一种种多媒体数据集中处理系统, 包括资源数据库,包括视音频数据库、XML对象数据库及文本语音关联模块,其中,所述 视音频数据库用于存储素材文件和/或节目文件;所述XML对象数据库用于存储基于统一 元数据描述模型生成的素材文件和/或节目文件的XML对象,所述XML对象中包括描述所 述视音频数据对应文本属性的XML元数据;所述文本语音关联模块用于获取各语音数据的 语音特征量和时码,将各文本字符分别与对应语音的特征量和时码进行关联;业务支撑模块,用于生成对所述资源数据库进行处理的功能引擎,所述功能引擎 包括检索引擎,用于依据用户提交的搜索关键词,在所述XML对象数据库中查找匹配的文 本信息,并依据所述文本关联的语音特征量和时码提取对应的视音频信息;业务服务模块,用于依据节目制作的需求,与资源数据库进行交互,以及,配置相 应功能引擎的执行任务;业务应用模块,用于为用户提供最终的业务展现。优选的,所述功能引擎还包括媒体分析引擎、转码处理引擎、分级存储管理引擎和内容管理引擎,用于对所述资 源数据库进行管理、索引、检索和浏览。优选的,所述业务服务模块包括采集上载子模块,用于采集来自各个制作网络的多媒体数据并经媒体分析引擎处 理后,存储至相应的资源数据库中;编目审核子模块,用于对所述资源数据库中的数据进行编目处理;内容管理子模块,用于通过所述内容管理引擎、转码处理引擎和分级存储管理引 擎对所述资源数据库进行相应处理;索引检索子模块,用于配置检索引擎的执行任务;出库子模块,用于提供相应的节目文件和/或素材文件的下载或发布。优选的,所述语音的特征量包括音调、音色和频率的声音量化信息。优选的,所述视音频信息在搜索结果界面上展示为所述语音特征量和时码对应视 频帧的缩略图。优选的,所述视音频信息在搜索结果界面上展示为显示所述语音特征量和时码对 应视频帧的播放窗口。优选的,所述基于统一元数据描述模型生成的素材文件和/或节目文件的XML对 象由描述素材文件或节目文件预置属性的XML元数据组织形成。优选的,所述预置属性包括文件属性和内容属性。优选的,所述文件属性包括文件的归属组信息、过程记载信息、扩展属性信息和分类fe息。优选的,所述素材文件的内容属性包括场记元数据信息、版本信息、实体标记点元 数据信息、音频文件的格式信息、视频文件的格式信息、所有包含文件的格式信息、实体文 件的信息、视音频元数据信息、素材实体文件及相关元数据信息、图片属性信息和/或文本 属性信息;所述节目文件的内容属性包括场记元数据信息、版本信息、实体标记点元数据信 息、音频文件的格式信息、视频文件的格式信息、所有包含文件的格式信息、实体文件的信 息、故事板信息、文稿对象信息、串联单中包含的条目信息、串联单的信息、视音频元数据信 息、节目实体文件及相关元数据信息、图片属性信息和/或文本属性信息。与现有技术相比,本专利技术具有以下优点本专利技术通过将各文本字符分别与对应语音的特征量和时码进行关联,使得语音标 引与文本索引相结合,由于语音数据本身是从视音频数据中分离出来的,即其具有关联的 视频信息,在检索时,即可根据用户提交搜索关键词定位到文本,然后由文本定位到语音, 再由语音定位到视频,从而检索到相应的视频画面,从而方便用户简单、快捷地获得想要的 视频及关联文本信息,并不会过多占用系统资源。本专利技术对各类素材文件或节目文件中视音频数据及对应文本属性描述是以统一 的、规范化的基于XML对象的元数据进行定义的,这种统一对象的元数据模型不仅可以向 上屏蔽各种不同的多媒体内容格式,还为上层业务提供了统一的数据模型,从而不仅可以 完成传统媒体行业对视频、音频素材文件以及相关元数据信息的存储管理,还可以有效兼 容各种新媒体内容格式,满足所有文件格式的存储管理需求,使媒体行业、内容运营厂商以 及其他相关用户可以对各种结构化或非结构化文件进行统一管理和查询检索。附图说明图1是本专利技术的一种语音检索方法实施例的步骤流程图;图2是本专利技术的一种搜索结果展示效果的示意;图3是本专利技术的一种语音检索装置实施例的结构框图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本专利技术作进一步详细的说明。本专利技术可用于众多通用或专用的计算系统环境或配置中。例如多处理器系统、服 务器、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。参考图1,示出了本专利技术的一种语音检索方法实施例的步骤流程图,具体可以包括 以下步骤预置步骤11,预置素材文件或节目文件的XML对象数据库,所述XML对象中包括描 述视音频数据及对应文本属性的XML元数据;以及,获取各语音数据的语音特征量和时码, 将各文本字符分别与对应语音的特征量和时码进行关联;搜索步骤12,依据用户提交的搜索关键词,在所述XML对象数据库中查找匹配的 文本信息,并依据所述文本关联的语音特征量和时码提取对应的视音频信息;输出步骤13 在搜索结果界面上展示所述视音频数据及文本信息。可以理解,在本专利技术实施例中,素材文件或节目文件是以XML对象的方式存储于 数据库中,这种基于对象的数据管理模式,不仅可以有效兼容多种多媒体数据格式,在查询 检索时,还可以对XML对象中描述的所有资源进行快速定位。在具体实现中,所述素材文件或节目文件的I对象数据库可以通过以下步骤生成提取素材文件或节目文件的预置属性;采用预定义的XML描述模型组织所述预置属性,生成所述素材文件或节目文件的 XML对象;对所述XML对象进行持久化,存储到数据库中。其中,所述预置属性可以包括文件属性和内容属性。其中,所述文件属性本文档来自技高网...

【技术保护点】
一种多媒体数据集中处理系统,其特征在于,包括:资源数据库,包括视音频数据库、XML对象数据库及文本语音关联模块,其中,所述视音频数据库用于存储素材文件和/或节目文件;所述XML对象数据库用于存储基于统一元数据描述模型生成的素材文件和/或节目文件的XML对象,所述XML对象中包括描述所述视音频数据对应文本属性的XML元数据;所述文本语音关联模块用于获取各语音数据的语音特征量和时码,将各文本字符分别与对应语音的特征量和时码进行关联;业务支撑模块,用于生成对所述资源数据库进行处理的功能引擎,所述功能引擎包括检索引擎,用于依据用户提交的搜索关键词,在所述XML对象数据库中查找匹配的文本信息,并依据所述文本关联的语音特征量和时码提取对应的视音频信息;业务服务模块,用于依据节目制作的需求,与资源数据库进行交互,以及,配置相应功能引擎的执行任务;业务应用模块,用于为用户提供最终的业务展现。

【技术特征摘要】
一种多媒体数据集中处理系统,其特征在于,包括资源数据库,包括视音频数据库、XML对象数据库及文本语音关联模块,其中,所述视音频数据库用于存储素材文件和/或节目文件;所述XML对象数据库用于存储基于统一元数据描述模型生成的素材文件和/或节目文件的XML对象,所述XML对象中包括描述所述视音频数据对应文本属性的XML元数据;所述文本语音关联模块用于获取各语音数据的语音特征量和时码,将各文本字符分别与对应语音的特征量和时码进行关联;业务支撑模块,用于生成对所述资源数据库进行处理的功能引擎,所述功能引擎包括检索引擎,用于依据用户提交的搜索关键词,在所述XML对象数据库中查找匹配的文本信息,并依据所述文本关联的语音特征量和时码提取对应的视音频信息;业务服务模块,用于依据节目制作的需求,与资源数据库进行交互,以及,配置相应功能引擎的执行任务;业务应用模块,用于为用户提供最终的业务展现。2.如权利要求1所述的系统,其特征在于,所述功能引擎还包括媒体分析引擎、转码处理引擎、分级存储管理引擎和内容管理引擎,用于对所述资源数 据库进行管理、索引、检索和浏览。3.如权利要求2所述的系统,其特征在于,所述业务服务模块包括采集上载子模块,用于采集来自各个制作网络的多媒体数据并经媒体分析引擎处理 后,存储至相应的资源数据库中;编目审核子模块,用于对所述资源数据库中的数据进行编目处理; 内容管理子模块,用于通过所述内容管理引擎、转码处理引擎和分级存储管理引擎对 所述资源数据库进行相应处理;索引检索子模块,用于配置检索引擎的执行任务;出库子模...

【专利技术属性】
技术研发人员:李军何宇飞温晓瑶张万军闫鹏
申请(专利权)人:新奥特北京视频技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1