音频、视频内容的搜索方法技术

技术编号：4183099 阅读：554 留言：0更新日期：2012-04-11 18:40

一种音频、视频内容的搜索装置，包括：判断模块，用于判断当前流媒体文件是否包括音频文件和视频文件；音频指纹提取模块，与所述判断模块相连接，音频指纹分词模块，与所述音频指纹提取模块相连接；音频索引生成模块，与所述音频指纹分词模块相连接；视频指纹提取模块，与所述判断模块相连接；视频指纹分词模块，与所述视频指纹提取模块相连接；视频索引生成模块，与所述视频指纹分词模块相连接；搜索模块。本发明专利技术通过采用文本搜索引擎中的分词技术，在音视频指纹文件上进行分词处理，然后采用文本搜索领域中的索引技术对音视频指纹进行索引处理，搜索引擎可以对用户输入的音视频片段进行搜索。不但方便了用户的搜索，而且提高了搜索的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及。技术背景随着互联网的发展，搜索引擎成为人们上网必不可少的工具之一。传统的搜索引擎都是基于文本搜索(Text Search)，称为是文本搜索引擎。其原理是搜索引擎服务器收集大量的网页；并根据已有的规则提取网页中的文本并做分词(Word Segmentation)处理，常见的分词方法，例如基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法; 文本搜索引擎利用文本词库做索引表用于快速搜索。用户在进行搜索的时候，将文本输入到服务器，服务器对该文本进行分词处理后，根据索引表进行快速的搜索，然后返回结果。目前，搜索引擎都是基于文本的，即使是一些搜索图片或视频的搜索引擎也是通过图片或视频节目的名称、说明、介绍、标签等文本信息进行搜索的。搜索引擎还没有直接通过音视频的信号内容进行搜索的。这里，我们所说的音视频是指音频文件或者视频文件。通常视频文件包含音频信号流和视频信号流。音频指纹(audio fingerprinting)在很早以前就被提出来，例如，Jaap Haitsma和Ton Kalke在2002年音乐搜索进展国际会议(Proceedings of International Conference on Music Information Retrieval)上发表了 "一种高可靠性的音频指纹系统"(A Highly Robust Audio Fingerprinting System)。这种系统通过信号处理的方法,将音频文件中每隔一段时间(例如11.6ms)的音频信号，转化为一个32比特(bit)大小的指纹(fi...

【技术保护点】
一种音频、视频内容的搜索装置，其特征在于包括：　　判断模块，用于判断当前流媒体文件是否包括音频文件和视频文件；　　音频指纹提取模块，与所述判断模块相连接，用于提取多个音频文件的音频指纹；　　音频指纹分词模块，与所述音频指纹提取模块相连接，用于对提取的音频指纹进行分词；　　音频索引生成模块，与所述音频指纹分词模块相连接，用于根据分词结果生成音频指纹索引；　　视频指纹提取模块，与所述判断模块相连接，用于提取多个视频文件的视频指纹；　　视频指纹分词模块，与所述视频指纹提取模块相连接，用于对提取的视频指纹进行分词；　　视频索引生成模块，与所述视频指纹分词模块相连接，用于根据据分词结果生成视频指纹索引；　　搜索模块，与所述音频索引生成模块和视频索引生成模块相连接，利用所述音频指纹索引搜索匹配的音频文件，利用所述视频指纹索引搜索匹配的视频文件。

【技术特征摘要】

【专利技术属性】
技术研发人员：连惠城，程建章，
申请(专利权)人：未序网络科技上海有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人