用于重现音频数据的装置和方法以及用于其中的计算机程序产品制造方法及图纸

技术编号:3059303 阅读:169 留言:0更新日期:2012-04-11 18:40
一种用于回放存储的音频数据(Ai)的设备(12),具有存储装置(19)、控制装置(20)和音频回放装置(27),其中音频数据(Ai)对应于来自一个由单词组成的文本的文本数据(Ti),存储装置(19)用于存储音频数据(Ai),存储到存储装置(19)的音频数据(Ai)能够以正向顺序被读取,控制装置(20)用于控制存储的音频数据(Ai)以正向模式和反向模式回放,其中这样设置控制装置(20),在以反向模式回放音频数据(Ai)的过程中,从音频数据(Ai)中的特定瞬时回放位置开始,与正向顺序相反,它自动启动一个向后跳转,越过一个对应于至少大约两个单词长度的返回距离(1A,2A,3A,……6A),到达一个目标位置,随后,从该特定目标位置开始,仅为该返回距离(1A,2A,3A,……6A)的一部分(1B,2B,3B,……6B)进行以正向顺序的音频数据(Ai)的回放。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于回放音频数据的装置,具有存储装置、控制装置和音频回放装置,其中音频数据对应于来自一个由单词组成的文本中的文本数据,存储装置用于存储该音频数据,存储到存储装置的音频数据能够以正向顺序被读取,控制装置用于控制存储的音频数据以正向模式和反向模式回放。本专利技术进一步涉及一种用于回放存储在存储装置中的音频数据的方法,其中音频数据对应于来自一个由单词组成的文本中的文本数据,存储到存储装置的音频数据以正向顺序被读取,在该方法执行过程中,能够控制音频数据以正向模式和反向模式回放。本专利技术进一步涉及一种计算机程序产品,以及涉及为执行这种计算机程序产品而设计的一种计算机。
技术介绍
在文本的手工或自动转录中,特别是在使用语音识别系统自动修正转录的文本时,通常通过例如头戴受话器的音频回放装置,收听口述的文本,以音频数据的形式进行数字存储,其中在已经转录了文本并且不得不修正文本的情况下,可以是通过文本显示装置(例如一个计算机工作站的监视器),同时显示对应于所存储的音频数据并已经作为文本文件存储的文本。具体的,由此还知道为相互关联的音频数据和文本数据提供对应的单词标记数据做为链接数据,其指示例如一个单词的开始,并显示相互对应的(即匹配的)音频数据和文本数据,从而能够以正向模式用声音和可视地同步回放它们。为此目的的适用技术描述在例如专利文件WO01/46853A1中。由此还知道为当前正声音回放的特定单词在可视显示的文本部分中将被可视地高亮显示,这也可以通过使用由单词标记数据或联接数据组成的控制数据来实现。因此,只有在正向模式和正向顺序时才允许相关单词的收听和显示。如果发生,与正向顺序相反,从一个瞬时回放位置开始,返回到一个在前的文本位置,那么也可以同时启动一个音频回放,但是这同样与正向顺序相反,并且因此处于不可理解的形式。例如,如果自动或人工的转录一个口述,并且从事转录和修正(如果适用的话)的人不同于叙述该口述的人,那么这个从事转录的人发现返回到在先的文本位置会特别不顺利,因为他完全不明白所讲出的文本,并且因为根据可用的软件,以数字形式存储在存储装置中的音频数据以与正向顺序相反的一种不可理解的形式迅速连续地呈现给他。那么对于这个人来说必须人工切换到正向顺序回放并收听所关心的口述段落,并且在在先的自动转录的情况下,可视地检查相关的文本字,其中与可视显示的文本同步的音频回放仅在这种正向模式下是可能的。这意味着一个相当大的时间输入,其结果是削弱这个人处理该文本时的注意力。对他的处理效率也会造成不利的影响。美国专利文件US2002/0062214A1披露了一种文本标记系统,其中在计算机监视器上显示单词组,其中为不同的工作步骤的控制提供切换区域。为了从一个标记的单词(在一个文本行中被高亮显示)处跳转到紧接在它之前的单词或者紧随其后的单词,以便高亮显示这个单词并且同时用语音来回放它,在此提供了两个被分别激活的切换区域。然而,这个控制系统非常费时费力,如果从一个特定的单词开始寻找它前面的一个相对长的距离的一个文本位置,例如它前面10或20个单词,其中必须反复在适当的切换区域上手动点击。
技术实现思路
本专利技术的一个目的是补救这种情形,并实现一种装置和方法,从而能够在存储的音频数据中进行口述文本段落的迅速目标查找,其中要求从事处理的人只需要可能的最少的人工控制干预。为了实现上述目标,根据第一个方面,本专利技术提供了一种用于回放存储的音频数据的装置,具有存储装置、控制装置和音频回放装置,其中音频数据与来自一个由单词组成的文本中的文本数据相对应,存储装置用于存储音频数据,存储到存储装置的音频数据能够以正向顺序被读取,控制装置用于控制存储的音频数据以正向模式和反向模式回放,其中这样设置控制装置,在以反向模式回放音频数据的过程中,从音频数据中的特定瞬时回放位置开始,与正向顺序相反,它们自动启动一个向后跳转,越过一个与至少大约两个单词的长度相对应的返回距离,到达一个目标位置,随后,从该特定目标位置开始,仅为该返回距离的一个部分启动以正向顺序的音频数据的回放。根据第二个方面,本专利技术提供一种用于回放存储在存储装置中的音频数据的方法,其中音频数据与来自一个由单词组成的文本中的文本数据相对应,存储到存储装置的音频数据以正向顺序被读取,在该方法中,能够控制音频数据以正向模式和反向模式回放,其中,在以反向模式进行音频数据回放的过程中,从音频数据中的特定瞬时回放位置开始,与正向顺序相反,自动启动一个向后跳转,越过一个与至少大约两个单词的长度相对应的返回距离,到达一个目标位置,随后,从该特定目标位置开始,仅为该返回距离的一个部分启动以正向顺序的回放。使用根据本专利技术的这种方法,与现有技术的情况相比,能够更迅速和更有效地在音频数据中进行特定文本段落的搜索。例如,如果在由人进行的文本转录和修正的过程中,当到达了一个文本位置时,出现一个问题,即,这个人可能认为在先前转录或修正的文本位置处不清楚或有差异或有错误,该位置在正进行转录或修正的文本前10或20个单词处,在启动了根据本专利技术的方法后,能够非常迅速和完全自动地以反向模式进行一个相应的搜索,借此,在计算机的辅助下,根据指定的返回距离,自动跳转到该文本中位于更后方的目标位置,并且随后仅对于该特定返回距离的指定部分以正向顺序进行一个声音回放。结果,实现了一种可理解的音频回放,于是所述的人不存在理解的问题。如果一个对应的转录文本已经可用,那么在由音频数据表示的文本中进行向后跳转,最好使用单词标记数据做为控制字符,控制字符通常指示一个新单词的开始。如果还没有转录文本可用,那么估算在该音频数据中自动向后跳转的返回距离,例如为等于平均数据长度或至少两个单词的时间,其中,例如,一或两秒的正向回放时间构成了基础。在上下文中,由于音频数据可以根据平均“单词长度”分为多个分段,因此,也能够说,特定的返回距离不必精确地等于多个实际口述单词的长度。同样的情况适用于在每次向后跳转后提供的以正向顺序回放的持续时间。因此,在根据本专利技术的方法中,可以进行(大约)两个或三个单词的向后跳转,随后(至少)一个单词的自动音频回放,其中当前回放的这个单词后来将是在随后的程序步骤中在音频数据内向后跳转越过的这两个或三个单词中的一个。然而,也可设想向后跳转一个对应于较大数量的单词的返回距离,并且当以正向顺序回放时,在口述文本中一次仅激活或回放一个单词,于是例如,仅回放每第四或第五个单词。然而,也可以以正向顺序回放多个单词。可以是简单的单词式的进行音频回放,即,如果单词标记数据是可用的,那么等待处理下一个单词标记数据的出现,其中该下一个单词标记数据识别下一个单词的开始。然而,也可以使用一个固定的回放时间进行分段式回放,所述固定的回放时间例如在0.5到1.5秒的范围内,例如等于一个平均单词持续时间,由一个定时电路对其进行规定。在大多数情况下具有相应单词标记数据的转录文本不可用。还设想,一个要回放的单词做为一个整体,并且下一个标记的单词仅部分地在该单词的开始处。进一步设想,从事处理的人在上述不同的选项之间进行选择。在所述的反向搜索运行期间,根据本专利技术进一步优选的是,以可调整的速度进行正向顺序的特定音频的回放,使从事处理的人将该搜索运行当作一个整体,如要求的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于回放存储的音频数据(Ai)的设备(12),具有存储装置(19)、控制装置(20)和音频回放装置(27),其中音频数据(Ai)对应于来自一个由单词组成的文本的文本数据(Ti),存储装置(19)用于存储音频数据(Ai),存储到存储装置(19)的音频数据(Ai)能够以正向顺序被读取,控制装置(20)用于控制存储的音频数据(Ai)以正向模式和反向模式回放,其中这样设置控制装置(20),在以反向模式回放音频数据(Ai)的过程中,从音频数据(Ai)中的特定瞬时回放位置开始,与正向顺序相反,它自动启动一个向后跳转,越过一个对应于至少大约两个单词长度的返回距离(1A,2A,3A,……6A),到达一个目标位置,随后,从该特定目标位置开始,仅为该返回距离(1A,2A,3A,……6A)的一部分(1B,2B,3B,……6B)进行以正向顺序的音频数据(Ai)的回放。2.如权利要求1所述的设备,其中控制装置(20)这样设置,使用指定给单词的单词标记数据(Mi)作为控制数据,它启动一个到特定目标位置的向后跳转。3.如权利要求2所述的设备,其中指定一个计数装置(31)给控制装置(20),来计数在向后跳转或回放期间达到的标记数据(Mi)。4.如权利要求1所述的设备,其中指定一个记时电路(30)给控制装置(20),来计算音频回放的持续时间。5.如权利要求1所述的设备,其中一个设定装置(32)被连接到控制装置(20),来设定音频回放的速度。6.如权利要求1所述的设备,其中控制装置(20)进一步连接到用于存储对应于音频数据(Ai)的文本数据(Ti)的文本存储装置(18),文本存储装置(18)连接到文本显示装置(22),并且其中控制装置(20)设置为通过用于音频数据(Ai)和文本数据(Ti)的链接数据,来启动音频数据(Ai)和与其对应的文本数据(Ti)的一个同步回放。7.如权利要求6所述的设备,其中控制装置(20)和文本存储装置(18)以及用于音频数据(Ai)的存储装置(19)连接到语音识别装置(17),语音识别装置(17)进行一个自动的转录。8.一种用于回放存储在存储装置(19)中的音频数据(Ai)的方法,其中音频数据(Ai)对应于来自一个由单词组成的文本的文本数据(Ti),存储到存储装置(19)的音频数据(Ai)以正向顺序被读取,在该方法中,能够控制音频数据(Ai)以正向模式和反向模式回放,其中,在以反向...

【专利技术属性】
技术研发人员:K·弗兰庞甘萨
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利