人声信号与其文字说明资料的同步的系统及其方法技术方案

技术编号:9832320 阅读:129 留言:0更新日期:2014-04-01 22:59
一种人声信号与其文字说明资料的同步的系统及其方法,其通过分析音频信号中的人声信号后取得人声信号中的语音段落的起始时间,并在将与音频信号对应的文字说明资料中的各词句依序对应至各语音段落后,调整各词句的显示时间为对应的语音段落的起始时间的技术手段,可以提高调整词句的显示时间的效率,并达成自动将词句的显示时间调整为出现对应人声的时间的技术效果。

【技术实现步骤摘要】
【专利摘要】一种,其通过分析音频信号中的人声信号后取得人声信号中的语音段落的起始时间,并在将与音频信号对应的文字说明资料中的各词句依序对应至各语音段落后,调整各词句的显示时间为对应的语音段落的起始时间的技术手段,可以提高调整词句的显示时间的效率,并达成自动将词句的显示时间调整为出现对应人声的时间的技术效果。【专利说明】
本专利技术涉及一种词句显示时间同步系统及其方法,尤其涉及一种。
技术介绍
动态歌词的技术方案可以让歌曲文档被播放时,读取歌曲文档所对应的歌词,并同步显示被播放的人声所表示的歌词。事实上,动态歌词并不只限于使用在歌曲文档,凡是所包含的人声有表示含义的多媒体文档都可以使用动态歌词同步显示人声所表示的词句。随着越来越多的多媒体播放软件或多媒体播放器支持动态歌词,多媒体文档的拥有者逐渐希望多媒体播放软件或多媒体播放器在播放多媒体文档中的音频信号时,可以同步显示被播放的人声所表示的词句。在提供执行动态歌词的文字说明资料中,必须包含与文字说明资料中所记录的各词句对应的显示时间,这样,多媒体播放软件或多媒体播放器才能在音频信号被播放的时间与各词句对应的显示时间相同时,同步播放各词句。虽然目前大部分的音频信号都有对应的文字说明资料以使用动态歌词的技术方案,且目前在文字说明资料中的各词句对应的显示时间与音频信号中各人声出现的时间有落差时,也有修改文字说明资料所记录的显示时间的工具软件。但是,这些工具软件仅提供用户手动逐一修改各词句的显示时间,或是对所有词句的显示时间进行整体性的增加或减少。由于目前仍有部分的音频信号所对应的文字说明资料仅记录音频信号的词句,而没有记录显示时间,另外,部分的音频信号则可能有多种的版本,每一种版本的出现人声的时间可能有一点差异,例如某些人声可能较词句被显示的时间早/晚被播放,若要手动自行新增或修改各词句的显示时间,这将花费大量的时间,非常没有效率。综上所述,可知现有技术中长期以来一直存在无法有效率的调整与音频信号对应的各词句显示时间的问题,因此有必要提出改进的技术手段,来解决这一问题。
技术实现思路
有鉴于现有技术存在调整词句的显示时间过于没有效率的问题,本专利技术遂揭露一种人声信号与其文字说明资料的同步系统及其方法,其中:本专利技术所揭露的人声信号与其文字说明资料的同步系统,至少包含:载入模块,用以载入音频信号,音频信号对应文字说明资料;人声抽取模块,用以由音频信号中抽取出人声信号,人声信号包含语音段落;段落分析模块,用以分析人声信号以取得语音段落的起始时间;词句对应模块,用以对应语音段落与文字说明资料中的各词句;时间调整模块,用以将词句的显示时间调整为相对应的语音段落的起始时间。本专利技术所揭露的人声信号与其文字说明资料的同步方法,其步骤至少包括:载入音频信号,音频信号对应文字说明资料;由音频信号中抽取出人声信号,人声信号包含语音段落;分析人声信号以取得语音段落的起始时间;将文字说明资料中的各词句依序对应至语音段落;调整词句的显示时间为相对应的语音段落的起始时间。本专利技术所揭露的系统与方法如上,与现有技术之间的差异在于本专利技术通过分析音频信号中的人声信号后取得人声信号中的语音段落的起始时间,并在将与音频信号对应的文字说明资料中的各词句依序对应至各语音段落后,调整各词句的显示时间为对应的语音段落的起始时间,由此解决现有技术所存在的问题,并可以达成自动将词句的显示时间调整为出现对应人声的时间的技术效果。【专利附图】【附图说明】图1为本专利技术所述的人声信号与其文字说明资料的同步系统架构图。图2为本专利技术所述的人声信号与其文字说明资料的同步方法流程图。主要部件附图标记:110 载入模块120 人声抽取模块130 段落分析模块150 词句对应模块160 时间调整模块190 播放模块步骤210载入音频信号,音频信号对应文字说明资料,文字说明资料包含多个词句步骤220由音频信号中抽取出人声信号,人声信号包含多个语音段落步骤230分析人声信号以取得语音段落的起始时间步骤250将文字说明资料中的各词句依序对应至各语音段落步骤260调整词句的显示时间为相对应的语音段落的起始时间步骤280播放音频信号步骤290同步显示显示时间与音频信号的语音段落被播放时间相同的词句【具体实施方式】以下将结合附图及实施例来详细说明本专利技术的特征与实施方式,内容足以使本领域技术人员能够轻易地充分理解本专利技术解决技术问题所应用的技术手段并据以实施,由此实现本专利技术可达成的技术效果。本专利技术可以检测音频信号中的人声信号,并依据人声信号中的各个语音段落的起始时间调整与各个语音段落对应的词句的显示时间,使得所有词句都能够在相对应的语音段落被播放时被显示,而没有提前或延后显示的现象。本专利技术所述的音频信号,至少包含人声信号,在被播放后会产生人声,例如,歌曲文档、相声录音文档等,但本专利技术并不以此为限,甚至,音频信号也可以包含在多媒体影音文档中。其中,人声信号可能包含一个或多个语音段落,每一个语音段落是以是否有人声来分隔的,也就是说,语音段落与语音段落之间没有人声。以下先以图1本专利技术所述的人声信号与其文字说明资料的同步系统架构图来说明本专利技术的系统运作。如图1所示,本专利技术的系统含有载入模块110、人声抽取模块120、段落分析模块130、词句对应模块150、以及时间调整模块160。载入模块110负责载入音频信号,一般而言,载入模块110是将音频信号载入执行本专利技术的装置的存储器(图中未示出)中,但本专利技术并不以此为限。载入模块110可以由执行本专利技术的装置的存储介质(图中未示出)载入音频信号,也可以由执行本专利技术的装置外部的装置载入音频信号,本专利技术没有特别的限制。载入模块110所载入的音频信号具有对应的文字说明资料,例如,当音频信号为歌曲文档时,文字说明资料为对应的歌词文档,当音频信号为相声录音文档时,文字说明资料为对应的字幕文档,当音频信号包含在多媒体影音文档中时,文字说明资料为包含该音频信号的多媒体影音文档的字幕文档等,但本专利技术的文字说明资料并不以上述为限。与音频信号对应的文字说明资料可能被储存在本专利技术的装置的存储介质中,也可能被储存在执行本专利技术的装置外部的装置中,本专利技术没有特别的限制。值得一提的是,音频信号与对应的文字说明资料并不一定会储存在相同的装置中。一般而言,载入模块110在载入音频信号时,也会将相对应的文字说明资料载入执行本专利技术的装置的存储器中,但本专利技术并不以此为限。人声抽取模块120负责由载入模块110所载入的音频信号中抽取人声信号。其中,人声抽取模块120所抽取的人声信号被播放的时间会与载入模块110所载入的音频信号被播放的时间相同。人声抽取模块120可以衰减音频信号中的特定频率,例如,衰减音频信号中范围在300Hz至3000Hz之外的频率,这样,非人声的频率将被衰减,也就是说,音频信号在经过衰减后,留下的部分主要为人声信号。人声抽取模块120也可以将音频信号的左声道反向后,叠加到右声道,并将音频信号的右声道反向后,叠加到左声道,这样,可以得到消除人声的中间信号,接着在将消除人声的中间信号反向后与原始的音频信号叠加,或反向原始的音频信号后与中间信号叠加,叠加后产生的信号即为人声信号。但本专利技术的人声抽取模块120由音频信号中抽取人声信本文档来自技高网
...

【技术保护点】
一种人声信号与其文字说明资料的同步方法,其特征在于,该方法至少包含下列步骤:载入音频信号,该音频信号对应文字说明资料,该文字说明资料包含多个词句;由该音频信号中抽取出人声信号,该人声信号包含多个语音段落;分析该人声信号以取得各该语音段落的起始时间;将该文字说明资料中的各词句依序对应至各该语音段落;及调整各该词句的显示时间为相对应的语音段落的起始时间。

【技术特征摘要】

【专利技术属性】
技术研发人员:丁科
申请(专利权)人:英业达科技有限公司 英业达股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1