当前位置: 首页 > 专利查询>谢丽娟专利>正文

一种多媒体字幕识别显示方法技术

技术编号:24353649 阅读:15 留言:0更新日期:2020-06-03 02:06
本发明专利技术公开了一种多媒体字幕识别显示方法,包括建立文字播放的声音波形特征与文字关联的数据库;读入多媒体文件;将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征;根据波形特征调集数据库中对应地文字;输出文字字幕。本发明专利技术一种多媒体字幕识别显示方法,自动提取声音进行识别配置字幕,不仅方便原始多媒体数据的字幕配置,也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。

A method of multimedia caption recognition and display

【技术实现步骤摘要】
一种多媒体字幕识别显示方法
本专利技术涉及多媒体处理
,具体而言,是一种多媒体字幕识别显示方法。
技术介绍
随着科技进步,随身电子装置的功能愈来愈多元,愈来愈多的随身电子装置提供文字阅读、聆听音乐或是影片观看的功能,如一般熟知的MP3装置,或是具有音像播放的移动电话、PDA等。由于数字化的多媒体(包括文字、图像、音乐)文件中载有各种信息,故通过上述电子装置播放过程通常可同时显示当中的信息,如播放MP3声音文件时,可以同时提取出歌词,并再结合后播放。或者播放影像文件时,显示字幕信息等。但歌词或者字幕传统的配置方式是人工配置导入,效率很低;而且有多媒体文件原始就没有字幕。有鉴于此,特提出本专利技术。
技术实现思路
本专利技术的目的是提供一种新的多媒体字幕识别显示方法,克服上述不足。为了实现上述目的,本专利技术提供的一种多媒体字幕识别显示方法,包括建立文字播放的声音波形特征与文字关联的数据库;读入多媒体文件;将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征;根据波形特征调集数据库中对应地文字;输出文字字幕。所述的多媒体字幕识别显示方法中,建立显示解析度规则,包括:根据多媒体文件显示解析度,动态调整显示字幕的段落位置与显示字幕的大小。所述的多媒体字幕识别显示方法中,建立系统语系规则,包括确定多媒体文件所属语系,根据多媒体文件所属语系将提取的波性特征关联数据库中对应地语系文字。本专利技术提具有如下有益效果;本专利技术一种多媒体字幕识别显示方法,自动提取声音进行识别配置字幕,不仅方便原始多媒体数据的字幕配置,也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。具体实施方式下面对本专利技术技术方案进行详细阐述,以便于理解。一种多媒体字幕识别显示方法,包括建立文字播放的声音波形特征与文字关联的数据库;读入多媒体文件;将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征;根据波形特征调集数据库中对应地文字;输出文字字幕。所述的多媒体字幕识别显示方法中,建立显示解析度规则,包括:根据多媒体文件显示解析度,动态调整显示字幕的段落位置与显示字幕的大小。所述的多媒体字幕识别显示方法中,建立系统语系规则,包括确定多媒体文件所属语系,根据多媒体文件所属语系将提取的波性特征关联数据库中对应地语系文字。本专利技术一种多媒体字幕识别显示方法,自动提取声音进行识别配置字幕,不仅方便原始多媒体数据的字幕配置,也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。本文中应用了具体个例对专利技术构思进行了详细阐述,以上实施例的说明只是用于帮助理解本专利技术的核心思想。应当指出,对于本
的普通技术人员来说,在不脱离该专利技术构思的前提下,所做的任何显而易见的修改、等同替换或其他改进,均应包含在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种多媒体字幕识别显示方法,其特征在于:包括/n建立文字播放的声音波形特征与文字关联的数据库;/n读入多媒体文件;/n将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征;/n根据波形特征调集数据库中对应地文字;/n输出文字字幕。/n

【技术特征摘要】
1.一种多媒体字幕识别显示方法,其特征在于:包括
建立文字播放的声音波形特征与文字关联的数据库;
读入多媒体文件;
将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征;
根据波形特征调集数据库中对应地文字;
输出文字字幕。


2.根据权利要求1所述的多媒体字幕...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:谢丽娟
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1