在数字音频产生过程中用于适应主要内容音频和次要内容剩余音频能力的方法技术

技术编号:3041204 阅读:153 留言:0更新日期:2012-04-11 18:40
本发明专利技术使得能够在音频制作过程的不同部分时包括话音和其余音频信息。具体地,本发明专利技术体现用于通过那些种类的音频压缩格式进行具有VRA能力的数字录制主带和包容VRA的技术,那些种类的音频压缩格式,比起保持等于或大于AC3压缩格式的、同等纯损失的任何编码译码器来能保持更小的音频数据损失。本发明专利技术方便了对数字音频媒体格式进行由最终用户进行的话音对其余音频(VRA)的调节,这是通过集中在整个数字音频系统的多个部分的新的结构而实现的,由此来实现一种新技术,这种技术的意图是让希望控制音频节目的主要声音/对话内容对该节目中音频内容的其余部分的比值的音频最终用户(最终收听者)能够获益。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理,更具体地,涉及增强各个不同的收听者想要的音频信号部分。
技术介绍
最近广泛地综合数字音频文件的归档、压缩、传输、译码、和重放,导致实际上在数字音频处理的每个阶段中新的机会的可能性。最近显示,话音对剩余音频(VRA)的优选的比值对于不同的人是显著地不同的,并且对于不同的类型的媒体节目(体育节目和音乐相比,等等)也是不同的。参阅Blum等,“AStudy of Listener Preferences UsingPre-Recorded Voice-to-Remaining Audio(通过使用预先记录的话音对其余音频对听众喜好进行研究)”,HEC Technical Report No.1,January,2000。具体地,VRA是指对音频节目的语音对其余音频的比值的个人化调节,这种个人化调节是通过在单独调节其余音频音量时独立地单独调节声音(语音)的音量而实现的。由用户独立调节的话音音频信息然后与由用户独立调节的其余音频信息相组合,并被发送到一个在其中可以施加进一步的总音量调节的重放设备。这个技术是通过发现每个不同的个人的收听能力就像他们的收视能力一样有很大的不同而被激发的,由此导致产生每个不同的个人所希望(或甚至需要)的收听音频节目时的话音相对于背景内容的个人喜好。结论是在音频节目中对VRA能力的需要,正如为了给每个人提供最佳收视特性而对于各种各样的传统透镜的需要一样,它们同样是重要的。专利技术概要本专利技术使得在音频产生过程的不同部分能够包括话音和其余音频的信息。具体地,本专利技术体现了通过利用某些种类的音频压缩格式进行具有VRA能力的数字录制主带(mastering)和包容VRA的特殊技术,这些种类的音频压缩格式比起保持等于或大于AC3压缩格式的同等的纯损失的任何编码译码器,都能保持更小的音频数据损失。本专利技术为便于最终用户对数字音频媒体格式进行话音对其余音频(VRA)的调节,通过把注意力集中在整个数字音频系统的多个部分的新颖配置上,由此能实施一种新技术,这种技术的意图是使得希望控制音频节目的主要声音/对话内容对该节目中音频内容的其余部分的比值的音频最终用户(最终收听者)获益。促进这里描述的本具体的专利技术的问题存在于两个方面。首先,已认识到在用于构建能够进行VRA调节的两个信号的音频节目产生路径中对于最佳的位置有不同的见解。其次,在最佳音频压缩格式、音频文件贮存需要、音频广播传输比特速率、音频流比特速率、与最后传递到最终用户的话音和其余音频内容的感觉到的收听质量之间有矛盾。为了实现将VRA提供给最终用户的最终目的,这两个问题的各种解决方案是由本专利技术通过可以综合新的或现有的数字录制主带、音频压缩、编码、文件贮存、传输、和译码技术的新的实施例而提供的。另外,本专利技术可适用于产生音频节目的各种方式,这样,所谓的纯话音音频内容和其余音频内容可以方便地被制成,以便用于贮存和/或传输。这样,记录过程被认为是音频产生过程的一个整体部分。新的音频内容可以以透明的方式被传递到最终收听者,而不管可被使用于数字贮存和或音频信号传输的具体的音频压缩算法。这将需要把话音和其余音频信息实际包括在任何CODEC(编码译码器)中。所以,本专利技术规定了独特的数字录制主带处理和未压缩的贮存格式,它们可以与在许多情形下使用的无损的和最小损耗的压缩算法相兼容。本专利技术的实施例也集中在对于VRA编码和VRA译码所需要的特性。因为在多种音频编码译码器之间的共同性,所以下面给出的所有的说明可被看作为对于广播媒体(诸如电视或网络广播)、音频流、CD音频、或DVD音频提供同样好的VRA功能。本专利技术也打算用于所有的音频节目的形式,包括电影,记录片,视频,音乐,和体育事件。通过此后将会看到的本专利技术的这些和其他优点和特性,参照以下对本专利技术的详细说明、附属权利要求、和这里的几个附图,可以更清楚地了解本专利技术的本质。附图简述下面参照附图描述本专利技术,其中附图说明图1是显示传统的数字录制主带结构的图,图2A是显示用于两个通道的、具有VRA能力的数字主带(master)音频磁带的预混合的实施例的图,图2B是显示用于两个通道的、具有VRA能力的数字主带音频磁带的后混合的实施例的图,图3是显示用于具有SCRA下混合参量的一个通道的、具有VRA能力的数字主带音频磁带的预混合的实施例的图,图4A-E是显示具有VRA能力的数字主带磁带或文件的各个实施例的图,图5是VRA编码译码器的示例性图,图6是用于1通道的、具有VRA能力的、未压缩的数字主带的VRA编码译码器的示例性图,图7是用于2通道、具有VRA能力的、未压缩的数字主带的VRA编码译码器的示例性图,图8是显示具有VRA能力的编码器的另一个可能的实施例的示例性图,图9是显示具有VRA能力的编码器的另一个可能的实施例的示例性图,图10是显示具有VRA能力的编码器的另一个可能的实施例的示例性图,图11是显示具有VRA能力的编码器的另一个可能的实施例的示例性图,图12是显示具有VRA能力的编码器的另一个可能的实施例的示例性图,图13是显示接收数字比特流和把信号译码为两个音频部分的VRA格式译码器的图;以及图14是本专利技术的示例性音频信号处理系统的图。优选实施例说明VRA调节可被用作为用于各种形式的听力障碍的补救方法。音频技术专家将很快指出,对于几乎所有的形式的听力障碍的最佳解决方案是允许听力有障碍的收听者接收感兴趣的声音信号(通常是话音),而不受背景声音的“污染”。所以,可以预期VRA特性能改进听力有障碍的个人的生活。然而,最近的研究发现实际上在所有的人口分段中优选的信号(例如,体育播音员的话音)与其余音频信号(例如,观众的背景噪声)的最佳混合有重大的离散性。对于“收听音频信息方面的差异性”的这种需要的证明,是与整个地球上数以百万计的人类的总的差异性相一致的。这个发现是在数字音频的来临使得有可能发送大量高质量音频信息以及音频控制信息(或中间数据)到收听者这一时刻得出的。不幸地,至今在任何媒体形式中,还没有把VRA特性引入到数字音频中。在这个领域中的工作只限于提到的所谓的“听力障碍有关的业务”,它被配置为ATSC AC3数字音频标准的任选部分。参阅“A-54A Guideto the Use of the AC3(A-54AC3使用指南)”,ATSC报告,1995,它包含很短的段落,描述听力有障碍的用户如何希望只接收声音内容的专门准备的信号以作为AC3比特流的一部分,以及把调节的音量的声音内容与作为ATSC规定的比特流的一部分正常地发送的其他音频通道(主音频业务)进行混和。众所周知,在A54文件中提到的AC3音频格式是基于杜比(Dolby)实验室压缩算法,被数字音频专家称为“感知的编码”压缩格式。感知编码算法被设计成丢弃一定百分数的原始音频信号内容,以便减小归档的文件的贮存容量需求以及减小在实时广播中(诸如HDTV)必须发送的信息量。丢弃的音频数据假设为不受收听者注意的,因为算法试图只消除耳朵反正不能听见的那些数据。不幸地,感知编码算法遇到有关在一定的音频内容被丢弃后能否保持最终收听质量的由来已久的争论。在任何音频节目中提供VRA能力的一个根本理由是增强最终用户的理解和收听乐趣,这些最终用户当前被迫试图理解或本文档来自技高网...

【技术保护点】
运行具有VRA能力的编码译码器系统的方法,包括: 接受一个或多个PCPV/PCA信号和一个或多个SCRA信号的并行输入结构; 压缩PCPV/PCA信号和SCRA信号; 连同用于规定特定的压缩算法和被使用来处理PCPV/PCA和SCRA信号的合并方法的相应的相关数据一起,复用压缩的PCPV/PCA和SCRA信号,所述复用的信号作为具有VRA能力的文件而被存储,或被传送到相应的去复用器,它分离PCPV/PCA和SCRA信号,为它们规定路由到适当的解压算法,以及把信号输出到贮存媒体或VRA音量可调节的输出设备。

【技术特征摘要】
【国外来华专利技术】US 2000-5-26 09/580,205;US 2000-3-2 60/186,3571.运行具有VRA能力的编码译码器系统的方法,包括接受一个或多个PCPV/PCA信号和一个或多个SCRA信号的并行输入结构;压缩PCPV/PCA信号和SCRA信号;连同用于规定特定的压缩算法和被使用来处理PCPV/PCA和SCRA信号的合并方法的相应的相关数据一起,复用压缩的PCPV/PCA和SCRA信号,所述复用的信号作为具有VRA能力的文件而被存储,或被传送到相应的去复用器,它分离PCPV/PCA和SCRA信号,为它们规定路由到适当的解压算法,以及把信号输出到贮存媒体或VRA音量可调节的输出设备。2.音频产生方法,包括在多个音频轨道中提供至少一个轨道,该轨道包括主要内容纯话音(PCPV)音频,该多个音频轨道被存储在贮存媒体中,以及多个音频轨道具有时间同步;从该至少一个轨道产生PCPV信号;通过使用具有第一压缩比的数字压缩格式压缩PCPV信号;在多个音频轨道中提供至少一个其他轨道,该至少一个其他轨道包括次要内容其余音频(SCRA)音频;从该至少一个其他轨道产生SCRA信号;使用具有第二压缩比的数字压缩形式压缩SCRA信号;创建话音对其余音频(VRA)辅助数据通道,该VRA辅助数据通道识别具有VRA能力的数字主带为具有VRA能力的,以及识别PCPV和SCRA信号的重放参量;把以下信号以数字方式存储在具有VRA能力的数字主带中PCPV信号,SCRA信号,与VRA辅助数据通道;其中存储步骤保持时间同步。3.权利要求2的音频产生方法,其中多个音频轨道关系到至少具有主要话音内容和背景内容的音频节目。4.权利要求3的音频产生方法,其中PCPV信号包括足够的主要话音内容,从而使得音频节目的情节通过收听PCPV音频而传达到收听者。5.权利要求3的音频产生方法,其中SCRA信号包括足够的背景内容,从而使得音频节目的艺术价值通过把SCRA信号和PCPV信号相混和而被增强。6.权利要求2的音频产生方法,其中PCPV信号是单通道信号,立体声信号,和环绕声信号之一。7.权利要求6的音频产生方法,其中环绕声信号是5.1环绕声格式和7.1环绕声格式之一。8.权利要求2的音频产生方法,其中SCRA信号是单通道信号,立体声信号,和环绕声信号之一。9.权利要求8的音频产生方法,其中环绕声信号是5.1环绕声格式和7.1环绕声格式之一。10.权利要求2的音频产生方法,其中重放参量包括PCPV和SCRA信号的能彼此相对地实现每个信号的音量电平的自动控制的音量电平,从而使得,在重放期间SCRA信号基本上不掩盖PCPV信号。11.权利要求2的音频产生方法,其中第一压缩比是基本上小于12∶1的比值。12.权利要求2的音频产生方法,其中第一压缩比是基本上小于8∶1的比值。13.权利要求2的音频产生方法,其中第二压缩比是基本上小于12∶1的比值。14.权利要求2的音频产生方法,其中第二压缩比是基本上小于8∶1的比值。15.权利要求2的音频产生方法,其中用于把信号以数...

【专利技术属性】
技术研发人员:MA沃德雷WR桑德斯
申请(专利权)人:听觉增强有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1