多媒体辨识系统与方法,及其应用的多媒体客制化方法技术方案

技术编号:4125216 阅读:183 留言:0更新日期:2012-04-11 18:40
一种多媒体辨识系统与方法,及其应用的多媒体客制化方法,其中多媒体辨识系统包含有一数据提取单元、一数据辨识单元、以及一波形特征数据库。数据提取单元是用来提取欲辨识的多媒体数据,而数据辨识单元中包含有一声音波形转换单元、一波形特征提取单元、以及一波形特征比对单元,用来将欲辨识的多媒体数据作声音波形数据的转换、波形特征的提取、波形特征的分析以及识别比对。通过分析多媒体数据的声音波形,来辨识该多媒体数据,并将有关联的多媒体素材提供给使用者作多媒体数据的客制化编辑。

【技术实现步骤摘要】
,及其应用的多媒体客制化方法
本专利技术有关于一种多媒体辨识方法与系统,尤其是指一种利用辨识结果来实施多 媒体客制化的方法。
技术介绍
现今数字音像多媒体的技术蓬勃发展,不管是在信息分享或是娱乐的方面,多媒 体数据几乎是必定会被应用来作为信息分享或是娱乐之用。而一般音像多媒体数据,如歌 曲音乐录像带,通常都是由唱片公司授权制作公司,将歌曲、字幕、以及影片图片制作成音 乐录像带,因此其内容不易客制化,无法满足各种客户因时因地而异的需求。公知的多媒体数据,如音乐录像带,其显示播放的影片内容、图片内容、字幕和声 音等数据都是既定的,使用者要依照其需求作数据内容的修改,便要自行搜寻所需的图片、 影片、字幕,并用软件自行拼贴组合,以产生符合需要的多媒体数据,显得有些麻烦。因此,公知技术确实有可改善之处,并有其改进的必要。
技术实现思路
有鉴于此,本专利技术所要解决的技术问题在于,配合自行开发的多媒体数据辨识的 机制,自动找寻并提供对应于多媒体数据(如音乐录像带或各式的音乐文件,如古典乐曲、 流行歌曲等等)的一些多媒体素材,像是图片、影片、歌曲字幕等给使用者进行后续编辑, 让使用者得以依据其需求作多媒体数据的客制化编辑,并依需求作该多媒体数据的应用。为了达到上述目的,根据本专利技术的一方案,提供一种多媒体辨识系统,包含有一数 据提取单元、一数据辨识单元、以及一波形特征数据库。其中,数据提取单元是用来提取欲 辨识之一多媒体数据,像是音乐歌曲或是音乐录像带等,而耦接于数据提取单元的数据辨 识单元中又包含有一声音波形转换单元、一波形特征提取单元、以及一波形特征比对单元, 用来将欲辨识的多媒体数据作声音波形数据的转换、波形特征的提取、波形特征的分析以 及识别比对。另外,波形特征数据库则耦接于数据辨识单元,储存有相对应于至少一已知多 媒体数据的至少一已知波形特征。而根据本专利技术的另一方案,提供一种多媒体辨识方法,包含有将一多媒体数据的 一声音数据转换成一波形数据,然后提取波形数据的一波形特征,像是波形的峰值位置等, 接着再将波形特征与相对应于至少一已知多媒体数据的至少一已知波形特征作相似度的 比对,而依据比对的结果即可辨识该多媒体数据。另外,根据本专利技术的又一方案,提供一种应用上述多媒体辨识方法的多媒体客制 化方法,还包含有依据已辨识的该多媒体数据,读取相对应于已辨识多媒体数据的至少一 多媒体素材,并且传送给使用者作编辑,最后,接收使用者对多媒体数据的编辑,如图片影 片变更、声音调整、字幕编辑、文件格式转换,以及传送多媒体数据到使用者指定之电子装置。通过提取多媒体数据声音波形的特征,来辨识该多媒体数据,并自动找寻与该多媒体数据相关的图片、影片、歌曲字幕等多媒体素材,传送给使用者作编辑,让使用者得以 依据其需求作多媒体数据的客制化编辑,并依需求作该多媒体数据的应用。 以上的概述与接下来的实施例,皆是为了进一步说明本专利技术的技术手段与达成功 效,然而所叙述的实施例与图式仅提供参考说明用,并非用来对本专利技术加以限制。附图说明图1为多媒体辨识系统的一种实施例的方框图; 图2为多媒体辨识方法的一种实施例的流程图; 图3为多媒体客制化系统的一种实施例的方框图; 图4为多媒体客制化系统的另一种实施例的方框图; 图5为多媒体客制化系统的又一种实施例的方框图; 图6为多媒体客制化方法的一种实施例的流程图;以及 图7为多媒体客制化方法的另一种实施例的流程图。主要附图标记说明10多媒体辨识系统20伺服器30客户端装置40电子装置11数据提取单元13数据辨识单元131声音波形转换单元133波形特征提取单元135波形特征比对单元15波形特征数据库151已知波形特征31素材数据库311多媒体素材33数据编辑处理单元331文件格式转换单元333字幕编辑单元335背景编辑单元337声音编辑单元35数据编辑界面351素材购买选项353文件传输选项41移动电话43笔记本计算机45个人数字助理47台式计算机51通信单元S201 S207流程图步骤说明S601 S611流程图步骤说明S701 S717流程图步骤说明具体实施例方式通过分析比对多媒体数据的声音波形的特征,来辨识该多媒体数据,并找寻与该 多媒体数据相关的多媒体素材,提供给使用者作编辑,让使用者得以客制化编辑该多媒体 数据,且能够将该多媒体数据作更进一步的应用。请参阅图1,为多媒体辨识系统10的一种实施例的方框图,包含有一数据提取单 元11、一数据辨识单元13、以及一波形特征数据库15。其中数据提取单元11是用来提取欲 辨识的多媒体数据,例如当使用者用多媒体播放器播放一多媒体数据(如流行歌曲的音乐 影片)时,数据提取单元11便提取该多媒体数据作为欲辨识的多媒体数据,传至数据辨识 单元13作后续的辨识动作。该数据辨识单元13耦接于数据提取单元11,是通过分析比对所接收到的多媒体 数据的声音波形,来辨识该多媒体数据,其中包含有一声音波形转换单元131,是用来把多 媒体数据的声音数据转换成波形数据(例如将原本是MP3格式的声音数据,转换成WAV格 式的波形数据),并传送到波形特征提取单元133。然后波形特征提取单元133则是用来提 取其所接收到的波形数据的一波形特征,像是提取声音波形的峰值在波形数据中的位置等 等,并将该多媒体数据的波形特征传送到波形特征比对单元135。而波形特征比对单元135接收到从波形特征提取单元133传来的该波形特征后, 便从波形特征数据库15中读取相对应于至少一已知多媒体数据的至少一已知波形特征 151,并将该些已知波形特征151 —一与该波形特征作相似度比较,判断出最相似者,即可 辨识该多媒体数据。相似度比较的方式可以是计算已知波形特征151与欲辨识的波形特征 之间的汉明距离(Hamming distance),找出与欲辨识的波形特征的汉明距离最小的已知波 形特征151,而其所对应的已知多媒体数据即是辨识的结果。汉明距离(Hamming distance)代表的是两等长字元串列所对应位置的字元中,不 同字元的个数,因此若汉明距离为0,代表两等长字元串列完全相同,而若汉明距离为2,则 代表两等长字元串列中,有二个对应位置的字元不同,依此类推。所以汉明距离越小,即代 表两等长字元串列越相似。请参阅图2,为多媒体辨识方法的一种实施例的流程图,配合图1作说明,步骤包 含有声音波形转换单元131将一多媒体数据(例如流行歌曲的音乐录像带等有固定声音 数据的多媒体数据)的一声音数据转换成一波形数据,如步骤S201,并将波形数据传送到 波形特征提取单元133。接着波形特征提取单元133提取波形数据的一波形特征,如步骤 S203,像是波形峰值的位置等,并将波形特征传送到波形特征比对单元135。接着,波形特征比对单元135便从波形特征数据库15中读取相对应于至少一已知 多媒体数据的至少一已知波形特征151,并将该些已知波形特征151 —一与波形特征作比 对,如步骤S205,而比对的方式可以是计算该波形特征与各个已知波形特征151之间的汉 明距离等。最后,数据辨识单元13就依据波形特征比对单元135的比对结果,来辨识多媒6体数据,如步骤S207,如判断该多媒体数据,相同于与该波形特征的汉明距离最小的已知波 形特征本文档来自技高网...

【技术保护点】
一种多媒体辨识系统,其特征在于,包含有:一数据提取单元,以提取欲辨识的一多媒体数据;一数据辨识单元,耦接于该数据提取单元,包含有一声音波形转换单元,将该多媒体数据的一声音数据,转换成一波形数据;一波形特征提取单元,耦接于该声音波形转换单元,以提取该波形数据的一波形特征;一波形特征比对单元,耦接于该波形特征提取单元,以将该波形特征与至少一已知波形特征作比对;以及一波形特征数据库,耦接于该数据辨识单元,储存有相对应于至少一已知多媒体数据的这些已知波形特征。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵象华郑期成
申请(专利权)人:艾比尔国际多媒体有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1