一种多媒体字幕识别显示方法技术

技术编号：24353649 阅读：15 留言：0更新日期：2020-06-03 02:06

本发明专利技术公开了一种多媒体字幕识别显示方法，包括建立文字播放的声音波形特征与文字关联的数据库；读入多媒体文件；将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；根据波形特征调集数据库中对应地文字；输出文字字幕。本发明专利技术一种多媒体字幕识别显示方法，自动提取声音进行识别配置字幕，不仅方便原始多媒体数据的字幕配置，也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。

A method of multimedia caption recognition and display

全部详细技术资料下载

【技术实现步骤摘要】
一种多媒体字幕识别显示方法
本专利技术涉及多媒体处理
，具体而言，是一种多媒体字幕识别显示方法。
技术介绍
随着科技进步，随身电子装置的功能愈来愈多元，愈来愈多的随身电子装置提供文字阅读、聆听音乐或是影片观看的功能，如一般熟知的MP3装置，或是具有音像播放的移动电话、PDA等。由于数字化的多媒体(包括文字、图像、音乐)文件中载有各种信息，故通过上述电子装置播放过程通常可同时显示当中的信息，如播放MP3声音文件时，可以同时提取出歌词，并再结合后播放。或者播放影像文件时，显示字幕信息等。但歌词或者字幕传统的配置方式是人工配置导入，效率很低；而且有多媒体文件原始就没有字幕。有鉴于此，特提出本专利技术。
技术实现思路
本专利技术的目的是提供一种新的多媒体字幕识别显示方法，克服上述不足。为了实现上述目的，本专利技术提供的一种多媒体字幕识别显示方法，包括建立文字播放的声音波形特征与文字关联的数据库；读入多媒体文件；将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；根据波形特征调集数据库中对应地文字；输出文字字幕。所述的多媒体字幕识别显示方法中，建立显示解析度规则，包括：根据多媒体文件显示解析度，动态调整显示字幕的段落位置与显示字幕的大小。所述的多媒体字幕识别显示方法中，建立系统语系规则，包括确定多媒体文件所属语系，根据多媒体文件所属语系将提取的波性特征关联数据库中对应地语系文字。本专...

【技术保护点】
1.一种多媒体字幕识别显示方法，其特征在于：包括/n建立文字播放的声音波形特征与文字关联的数据库；/n读入多媒体文件；/n将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；/n根据波形特征调集数据库中对应地文字；/n输出文字字幕。/n

【技术特征摘要】
1.一种多媒体字幕识别显示方法，其特征在于：包括
建立文字播放的声音波形特征与文字关联的数据库；
读入多媒体文件；
将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；
根据波形特征调集数据库中对应地文字；
输出文字字幕。

2.根据权利要求1所述的多媒体字幕...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：谢丽娟，
类型：发明
国别省市：湖南;43

全部详细技术资料下载我是这个专利的主人