当前位置: 首页 > 专利查询>陈德卫专利>正文

一种实现音频和文本信息同步控制的方法和装置制造方法及图纸

技术编号:2989518 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种实现音频和文本信息同步控制的方法和装置。将包含了音频信息、文本信息、时间标签和控制标签的多媒体格式文件存储在存储装置中,在微处理器的控制下,读取所述多媒体格式文件,将其中的音频信息通过解码器和读听装置播放出来,同时将其中的文本信息通过显示装置显示出来。实施本发明专利技术的方法和装置,将原本分离处理的音频信息和文本信息建立同步,并结合在一起,使得消费者可以同步听到和阅读到这两部分的内容,非常方便使用。

【技术实现步骤摘要】

本专利技术涉及应用于数码产品的音频和文本信息的处理领域,尤其是涉及一种实现音频和文本信息同步控制的方法和装置
技术介绍
传统的便携式语言学习机等数码产品只能够支持单一媒体,即只有音频或者只有文字信息,因此无法实现多媒体的综合学习方式,功能单一。不仅如此,这些设备还依赖于书本、磁带以及CD等传统信息载体,无法独立工作。其原因在于一方面,各种非数字化的学习材料(特别是书本和磁带)孤立于电脑之外,无法存储并直接被用在电脑、互联网及其它数码产品上;另一方面,利用多媒体技术制作的外语学习材料是单独制作的,无法被直接用在现有的非数码便携式设备上;再一方面,现有技术中,音频信息和文本信息是分开处理的,不能实现同步处理以供消费者使用。目前,处理音频信息的方式基本上是采用对音频进行高度压缩的有损压缩算法MP3和WMA。MP3是MPEG-1 Layer3(MPEGMoving Pictures Experts Group)的缩写,是国际标准化组织(International Standard Organization)定义的一种压缩与解压缩的处理方式,用来处理高比率的声音信息。它所生成的声音文件音质接近CD,而文件大小却只有其十二分之一。WMA(Windows Media Audio)来自于微软,音质要强于MP3格式,它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1∶18左右。在微软的大规模推广下已经是得到了越来越多站点的承认和大力支持,在网络音频处理领域中得到越来越多应用。但是,MP3和WMA都只是处理音频信息,不处理语音的语义信息,使用在MP3随身听上时只能听,不能阅读。而且,MP3播放器连续播放整个文件(或整篇课文),而且一般只支持简单的“A-B”段落复读,由手工来确定复读的句段。这种方式很不实用,使用者要根据经验操作,往往只能取到完整句子的一部分,而不是整个的完整的句子,这样复读就意义不大。尤其在外语的学习使用过程中,许多用户反映无法准确地得到想复读的句子或者段落,并不适合于外语学习的使用。总之,目前在数码产品中,尤其是可以随身携带的产品中,没有将音频和文本信息结合到一起同步处理的方式,无法将二者结合应用,致使现有的数码产品大多数局限于音乐欣赏等娱乐活动。
技术实现思路
本专利技术的内容是解决现有的数码产品不能实现音频和文本信息同步控制的问题,而提供一种实现音频和文本信息同步控制的方法和装置。本专利技术是在利用MP3和WMA处理方式的基础上,提供一种实现音频和文本信息同步控制的方法和装置,将原本分离处理的音频信息和文本信息建立同步,并结合在一起,这样在播放音频信息时能够同时显示其相应的文本信息,且具有高压缩率。本专利技术的方法是这样实现的一种实现音频和文本信息同步控制的方法,所述方法是通过带有微处理器的数码装置来实现的;所述数码装置包括微处理器、解码器、存储装置、显示装置和读听装置,其中,读听装置连接到解码器上,并与解码器进行双向通讯,微处理器连接解码器、存储装置、显示装置;其特征在于,所述方法包括如下步骤(1)将音频信息和文本信息材料进行编辑,生成包含了音频信息、文本信息、时间标签和控制标签的多媒体格式文件,并存储在所述存储装置中;(2)在微处理器的控制下,读取存储在所述存储装置中的多媒体格式文件,根据所述多媒体格式文件中的时间标签和控制标签,将所述多媒体格式文件中的音频信息通过解码器和读听装置播放出来,同时将所述多媒体格式文件中的文本信息通过显示装置显示出来。其中,所述的多媒体格式文件是基于现有的LRC(英文单词Lyrics的缩写,是一种以.1rc为后缀的专为实现歌词和歌曲同步显示播放的文件格式)格式文件开发的特有的格式文件,其格式如下 音频信息+时间标签+控制标签1+文本1+控制标签2+文本2+...+控制标签N+文本N,N≥1。其与LRC格式的不同之处在于其中设置了控制标签,所述控制标签包括切换标签和段落标签。而LRC文件只定义了基本的时间标签以实现同步。文本信息紧随所述切换标签出现;当读取到切换标签时,其后的文本信息将被显示出来。所述切换标签可以有两个或两个以上,从而实现了在一个时间标签的控制下,可以携带多种文本信息。其中,第一个切换标签可以缺省。所述段落标签是用于控制分段操作,便于使用时进行分段循环播放。在本专利技术方法的步骤(1)中,所述多媒体格式文件的生成包括以下3个步骤(1.1)原始材料的准备分别收集语音信息和文本信息并存储在计算机中,所述语音信息可以是MP3、WMA或WAV格式的语音文件,所述文本信息可以是TXT或者LRC格式的文本文件;(1.2)加入同步标签和控制标签将语音文件和文本文件同时打开,在播放的同时加入时间标签和相应的控制标签;(1.3)合成多媒体格式文件在语音文件和文本文件同时打开的情况下,应用多媒体格式文件制作软件,将文件另存为多媒体格式文件,并存储在计算机里。本专利技术还提供了实现本专利技术方法的装置,包括微处理器、解码器、存储装置、显示装置和读听装置,其中,读听装置连接到解码器上,并与解码器进行双向通讯,微处理器连接解码器、存储装置、显示装置;其特征在于,所述存储装置中存储有多媒体格式文件,所述多媒体格式文件包含了音频信息、文本信息、时间标签和控制标签;所述微处理器控制对所述多媒体格式文件的读取,根据所述多媒体格式文件中的时间标签和控制标签,将所述多媒体格式文件中的音频信息通过解码器和读听装置播放出来,同时将所述多媒体格式文件中的文本信息通过显示装置显示出来。所述装置可以是便携式学习机或装有有关软件的个人计算机。实施本专利技术的方法和装置,将原本分离处理的音频信息和文本信息建立同步,并结合在一起,使得消费者可以同步听和看到这两部分的内容,非常方便使用。而且该控制方法使得音频信息和文本信息可同时存储于现有的数码产品中,便于随身携带使用,方便消费者的学习和娱乐。本专利技术尤其适用于语言的学习。附图说明图1为本专利技术一种实现音频和文本信息同步控制的方法中所使用的多媒体格式文件的格式原理图;图2为本专利技术的一种实现音频和文本信息同步控制的装置的结构示意图;图3为图2所示的装置应用于外语学习的系统组成示意图。具体实施例方式本专利技术的实施例主要是针对外语学习的情况。在本实施例中,采用了一种基于现有的LRC格式文件而开发的特有的多媒体格式文件(SMP3)。在SMP3文件中,保留了LRC文件的一般定义,同时,加入了一系列专用的标签,用于将LRC的功能扩充到更加适合于制作多媒体的外语学习材料中。如图1所示,所述SMP3格式文件包含有音频流、时间标签、文本信息标签、文本信息等要素。这些要素将有时间上的对应关系,从而实现相应的同步操作。音频流是通过MP3编码器,将模拟声音信号转化为数字信号,以二进制形式存在的,其编码和解码都按照国际标准化组织ISO的MPEG标准制定的;在实际使用中可用的音频流包括一系列将模拟声音信号转化为数字信号,以二进制形式存在的,WMA、ADPCM、AAC格式,其编码和解码都按照相应的国际标准制作的;时间标签为,其中mm表示分钟数,ss表示秒数,ff表示10毫秒数。时间标签的形式和一般表述时间的方法相同,是从音频流的起点开始计数,起到一个指针的作用;控制本文档来自技高网
...

【技术保护点】
一种实现音频和文本信息同步控制的方法,所述方法是通过带有微处理器的数码装置来实现的;所述数码装置包括微处理器、解码器、存储装置、显示装置和读听装置,其中,读听装置连接到解码器上,并与解码器进行双向通讯,微处理器连接解码器、存储装置、显示装置;其特征在于,所述方法包括如下步骤:(1)将音频信息和文本信息材料进行编辑,生成包含了音频信息、文本信息、时间标签和控制标签的多媒体格式文件,并存储在所述存储装置中;(2)在微处理器的控制下,读取存储在所述存储装置中的多媒体格式文件,根据所述多媒体格式文件中的时间标签和控制标签,将所述多媒体格式文件中的音频信息通过解码器和读听装置播放出来,同时将所述多媒体格式文件中的文本信息通过显示装置显示出来。其中,所述的多媒体格式文件的格式如下:音频信息+时间标签+控制标签1+文本1+控制标签2+文本2+…+控制标签N+文本N,N≥1。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈德卫李涛殷明
申请(专利权)人:陈德卫
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利