一种自动获取音视频字幕和歌词并快速定位检索及个性化显示的方法技术

技术编号:6055479 阅读:607 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种自动获取音视频字幕和歌词并快速定位检索及个性化显示的方法,由连接控制模块、特征值提取模块、字幕和歌词查找模块、字幕和歌词下载模块、字幕和歌词定位检索模块、字幕和歌词显示模块组成。通过该系统,用户提取到音视频资源的特征值后,连接到互联网,查找该资源对应的字幕或歌词文件,并将该文件下载到本地存储器上并对文件内容进行解析,将解析后的字幕或歌词随同音视频的播放而同步显示;使用本发明专利技术,可以快速而准确的查找到音视频资源的字幕或歌词文件。

Method for automatically acquiring captions and lyrics of music and video, and fast positioning, retrieval and personalized display

The present invention provides a method for automatic acquisition of audio and video subtitles and lyrics and fast location retrieval and personalized display, by connecting the control module, feature extraction module, search module, lyrics subtitles and subtitles and download the lyrics subtitle and lyrics positioning module, search module, display module and lyrics subtitle. Through this system, the user to extract features of audio and video resources value, connected to the Internet, to find the resources corresponding to the subtitles or lyrics file, and the file will be downloaded to the local memory and parses the contents of the documents, will be played after parsing the subtitles or lyrics with video and homophone synchronous display of the invention;, can quickly and accurately find the audio and video resource subtitles or lyrics file.

【技术实现步骤摘要】

本专利技术涉及互联网、音视频播放领域,尤其涉及一种自动获取音视频字幕和歌词 并快速定位检索及个性化显示的方法。
技术介绍
音视频播放同步显示歌词或字幕的功能使得人们在播放音视频的同时能够看到 该音视频文件的字幕或歌词,该功能已经成为了音视频播放软件及播放器的必备功能之 一。现有的同步字幕或歌词显示功能技术一般都是在播放音视频文件的同时,搜索与该音 频文件名称匹配的字幕或歌词文件,从而达到同步显示的目的。同步显示字幕或歌词信息,播放软件或播放器需要搜索与待显示音视频文件名称 同名的字幕或歌词文件,若搜索到,则同步显示字幕或歌词信息;否则,则做默认处理。然而 存在以下情况是现有技术无法解决的,如有很多音视频文件是具有相同的名字,却有不同 的字幕或歌词内容。例如“朋友”这首歌,有周华健演唱的,有臧天朔演唱的,还有张震岳 演唱的等等。这种情况下,与“朋友.mp3”相应的同步歌词文件“朋友.Irc “不止一个,而 且文件名都是一样的,播放软件就会搜索到多个同名的字幕或歌词文件,现有技术对于这 种同名文件不能进行有效的鉴别;音视频文件随便命名的情况,通过现有技术无法找到对 应的字幕或歌词文件,无法进行同步显示。
技术实现思路
针对上述这些问题,设计了一种自动获取音视频字幕和歌词并快速定位检索及个 性化显示的方法。该方法使用了音视频特征值,无论音视频文件如何转换、压缩、文件名称 如何变化,特征值都能唯一的标识音视频,通过这个特点就能以尽可能高的准确性获取音 视频字幕和歌词,不会出现音视频与字幕或歌词不匹配的问题。为了实现上述的专利技术,本专利技术的技术方案以如下方式实现,其结构特 点是,它是由连接控制模块,特征值提取模块,字幕和歌词查找模块,字幕和歌词下载模块, 字幕和歌词定位检索模块,字幕和歌词显示模块组成。连接控制模块在查询音视频的字幕或歌词时,负责连接到音视频字幕和歌词服 务器及音视频信息备案库。特征值提取模块提取要查询字幕或歌词的音视频特征值。字幕和歌词查找模块使用提取的音视频特征值作为条件,在音视频信息备案库 中查询,如果有记录,表示该音视频信息已经备案,那么提取标准的音视频名称,根据这个 名称可以查找到字幕或歌词;如果没有记录,表示该音视频信息没有备案,那么将特征值存 入音视频信息备案库,并打上没有字幕或歌词的标记,以备操作人员编辑。字幕和歌词下载模块锁定音视频字幕或歌词文件,根据下载设置把文件下载到本地存储器的指定目录中。字幕和歌词定位检索模块在音视频播放时,使用本模块从字幕或歌词文件中按 照时间点提取字幕或歌词,当用户拖动时间轴时,与时间轴上时间点对应的字幕或歌词也 需要移动,本模块可以针对不同格式的字幕和歌词文件,采用独有算法快速检索对应时间 轴上时间点的字幕或歌词。字幕和歌词显示模块本模块根据字幕和歌词定位检索模块锁定的字幕或歌词, 在音视频播放时显示出来,字幕或歌词在显示时可以调整字体大小、字体名称、字体颜色、 显示位置等属性。本技术进行在线音视频下载播放的步骤参看图1,本专利技术由连接控制模块1、特征值提取模块2、字幕和歌词查找模块3、字 幕和歌词下载模块4、字幕和歌词定位检索模块5、字幕和歌词显示模块6组成。实现对音 视频字幕和歌词的准确获取。参看图2,使用本专利技术获取音视频字幕和歌词并显示的流程1.通过特征值提取模块1针对视频和音频采用不同的方式提取特征值。2.通过连接控制模块2连接到音视频字幕和歌词服务器及音视频信息备案库。3.通过字幕和歌词查找模块3以特征值为条件查询音视频信息备案库,如果没有 查询到相应的记录,将音视频的特征值信息存入音视频备案信息库,并打上没有字幕或歌 词的标记,以备操作人员编辑;如果查询到相应的记录,提取标准的音视频名称,根据这个 名称锁定字幕或歌词文件。4.通过字幕和歌词下载模块4将通过字幕和歌词查找模块3锁定的字幕或歌词文 件,根据下载设置保存到本地存储器上的指定目录中。5.在字幕或歌词显示时,首先通过字幕和歌词定位检索模块5按照时间轴上的时 间点检索字幕或歌词,然后交给字幕和歌词显示模块6显示;当时间轴被用户拖动时,对应 的字幕或歌词也需要移动,通过字幕和歌词定位检索模块5使用独有的算法,快速检索定 位对应时间轴上时间点的字幕或歌词,并交给字幕和歌词显示模块6显示。附图说明图1为本专利技术的结构图;图2为本专利技术进行音视频字幕或歌词获取并显示的流程图; 具体实施例方式参看图1,本专利技术由连接控制模块1、特征值提取模块2、字幕和歌词查找模块3、字 幕和歌词下载模块4、字幕和歌词定位检索模块5、字幕和歌词显示模块6组成。实现对音 视频资源字幕和歌词的准确抓取。提高了用户的观赏性。参看图2,用本专利技术准备抓取音视频资源的字幕和歌词并显示1.通过特征值提取模块1当查找的是视频字幕时,视频特征值是利用每个相邻帧 间变化的特征,计算相邻帧间的相关性,选择相邻若干帧之间差异变化最大或差异变化最 小或符合确定规则的若干特征,将所述的特征块进行编码形成的特征值;当查找的是音频 歌词时,音频特征值是根据音频声音的波形变化计算得来的,音频声音的波形无论压缩、格式转换、声音大小调节、降噪等处理后,其波形变化规律是不变的,根据这个特性使用特有 的算法计算出该音频文件的特征值,通过以上的说明,可以确定特征值唯一的标识一个音 视频,通过特征值获取音视频的字幕或歌词,可以保证尽可能高的准确性。2.通过连接控制模块2自动连接到网络,并登陆音视频信息备案库,为音视频资 源的字幕、歌词的查询做准备。3.字幕和歌词查找模块3以特征值为条件对音频信息备案库进行查询。如果没有 查询到相应的记录,将音视频的特征值信息存入音视频备案信息库,并打上没有字幕或歌 词的标记,以备操作人员编辑;如果查询到相应的记录,提取标准的音视频名称,根据这个 名称锁定字幕或歌词文件。4.通过字幕和歌词下载模块4将通过字幕和歌词查找模块3锁定的字幕或歌词文 件,根据下载设置保存到本地存储器上的指定目录中。5.在字幕或歌词显示时,首先通过字幕和歌词定位检索模块5按照时间轴上的时 间点检索字幕或歌词,然后交给字幕和歌词显示模块6显示;当时间轴被用户拖动时,对应 的字幕或歌词也需要移动,通过字幕和歌词定位检索模块5使用独有的算法,快速检索定 位对应时间轴上时间点的字幕或歌词,并交给字幕和歌词显示模块6显示。权利要求1.,其特征在 于,所述方法包括以下步骤第一步骤提取音视频的特征值;第二步骤连接到音视频字幕和歌词服务器及音视频信息备案库; 第三步骤以特征值为条件查询音视频信息备案库,锁定字幕或歌词文件; 第四步骤将锁定的字幕或歌词文件,下载到本地存储器上的指定目录中; 第五步骤按照下载的字幕或歌词文件,在音视频播放时显示字幕或歌词。2.,其特征在 于,所述方法包括特征值提取模块,针对视频格式和音频格式采用不同的方式提取音视频的特征值; 连接控制模块,负责连接音视频字幕和歌词服务器及音视频信息备案库; 字幕和歌词查找模块,在音视频信息备案库中,以音视频特征值为条件,查询有无备案 记录并锁定字幕或歌词文件;字幕或歌词字幕和歌词下载模块,将锁定的字幕或歌词文件,按照下载设置下载到本 地存储器上的指定目录中;字幕和歌词定位检索模块,针对不用格式的字幕或本文档来自技高网...

【技术保护点】
一种自动获取音视频字幕和歌词并快速定位检索及个性化显示的方法,其特征在于,所述方法包括以下步骤:第一步骤:提取音视频的特征值;第二步骤:连接到音视频字幕和歌词服务器及音视频信息备案库;第三步骤:以特征值为条件查询音视频信息备案库,锁定字幕或歌词文件;第四步骤:将锁定的字幕或歌词文件,下载到本地存储器上的指定目录中;第五步骤:按照下载的字幕或歌词文件,在音视频播放时显示字幕或歌词。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙东亮郝雪松班志远武晓芳
申请(专利权)人:天擎华媒北京科技有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1