会议中使用改变视盲的感知连续性制造技术

技术编号:13897075 阅读:95 留言:0更新日期:2016-10-25 04:56
如下类型的音频会议混合系统中的方法,该类型的音频会议混合系统取得包括混合转换事件的会议参加者的输入音频信息的多个音频输入流,并输出包括输出音频信息的多个音频输出流,该方法混合音频输出流以降低混合转换事件的可检测性的方法,该方法包括以下步骤:(a)确定转换事件将发生;(b)确定掩蔽触发将发生;(c)安排转换事件基本上在掩蔽事件发生时发生。

【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉引用本申请要求于2014年2月28日提交的美国临时专利申请No.61/946,030的优先权的权益;该申请通过引用被整体结合于此。
本专利技术涉及音频电话会议领域,并且特别地,公开了利用改变视盲(change blindness)机制来掩蔽电话会议中的改变。
技术介绍
在整个说明书中对
技术介绍
的任何讨论绝不应该被视作承认这种技术广为人知或形成本领域公知常识的一部分。多个参加者远程互动以实施会议的视频和音频电话会议系统是重要的资源。许多系统是已知的。大多数系统依靠中央或分布式服务器资源来确保使用例如专用电话会议设备、带有音频输入/输出设施的标准计算机资源或智能手机类型的设备,每个参加者都能够听到和/或看到其他参加者。该分布式服务器资源负责将来自每个会议参加者的上行链路音频信号合适地混合在一起并将音频信号下行传输以供由每个音频输出设备回放。作为背景,在典型的(已知的)电话会议系统中,混合器接收来自电话终端中的每个电话终端的相应的‘上行链路流’,该‘上行链路流’承载由该电话终端捕获的音频信号,并发送相应的‘下行链路流’到电话终端中的每个电话终端。因而,每个电话终端接收下行链路流,该下行链路流能够承载由其他电话终端捕获的相应音频信号的混合。从而,当电话会议中两个或多个参加者同时说话时,其他一个(或多
个)参加者可以听到参加者两方说话。已知(且通常期望)混合器应用自适应手段,由此响应于在音频信号中的一个或多个中感知到某些变化而改变混合。例如,响应于确定音频信号不含有语音(即只有背景噪声),该音频信号可被从混合中省略。但是在错误的时间改变混合可能引起令人不安的伪影(artefact)被参加者听到。
技术实现思路
本文中公开的各种方法、设备、装置和系统可以提供改进形式的音频会议混合。根据本公开的第一方面,提供了一种在如下类型的音频会议混合系统中的方法,该类型的音频会议混合系统取得包括混合转换事件的会议参加者的输入音频信息的多个音频输入流,并输出包括输出音频信息的多个音频输出流,该方法混合音频输出流以降低混合转换事件的可检测性的方法,该方法包括以下步骤:(a)确定转换事件将发生;(b)确定掩蔽触发将发生;(c)安排转换事件基本上在掩蔽事件发生时发生。混合转换事件可以包括音频输入流编码中的改变,该改变在孤立收听时可被收听参加者注意到。优选地,掩蔽触发可以包括以下至少一个:语音的起始或终止;语音特性的预定改变,或预定数目的参加者的同时语音的起始。安排可以包括延迟转换事件的发生直到掩蔽触发发生。在一些实施例中,掩蔽触发可以包含会议参加者中的至少一个会议参加者对于预定文本的发言。在一些实施例中,在音频输入流中的一个音频输入流的音量和/或预定谱流量的增加的存在可以指示在音频输入流中的该一个音频输入流中的掩蔽触发。语音的起始或终止可以由音频输入流中的一个音频输入流中的声音活动标志的值的改变来表示。在一些实施例中,掩蔽事件可以由一系列音频输入流的听觉场景分析确定。音频输入流可以包括至少一个CTX(连续传输)音频输入流和至少一个DTX(离散传输)音频输入流。根据本公开的另外方面,提供了一种音频混合系统,该音频混合系统包括:多个音频流输入单元,该多个音频流输入单元接收来自多个音频输入/输出设备的音频输入上行链路流,音频输入上行链路信号包括在孤立收听时可被收听参加者注意到的音频上行链路流中的改变的转换事件信号,和表示音频输入上行链路流中的预定音频事件的掩蔽触发信号;以及一系列音频子混音单元,其中每个音频子混音单元形成用于返回到所述多个音频输入/输出设备中相应的一个的下行链路输出,音频子混音单元中的每个与音频流输入单元中的预定数个互连以混合与该数个音频流输入单元相关的音频输入上行链路流,音频子混音单元进一步包含:用于控制输入的音频流的混合的形式并且响应于转换事件信号而更改混合的形式的第一控制单元;用于延迟混合的形式的更改直到掩蔽触发信号存在于音频输入上行链路流中至少一个中时的第二控制单元。本文中公开的各种实施例可以具有特定的应用,其中系统和服务器能够将空间和/或较连续的音频信号集成到混合器和呈现的场景中。具体地,实施例可以对于期望可扩展性、因此期望较低计算复杂度和/或带宽占用的情况是有用的。实施例也可以在不存在系统约束时是有价值的,在这种情况下其用途主要是实现一定程度的感知场景复杂度降低,这必须还通过改变不同参加者音频信号在混合中的存在和贡献而发生。此外,存在使用这样的系统的情况,其中对于呈现的场景的行为和改变是由于来自用户控制输入或其他因素的传入的控制信号导致的。在这种情况下,本实施例的使用可以减小诸如声音流或对象结束、电平调整、空间渲染属性的改变、处理的改变,或任何其他改变的活动的影响,这样的活动通常将引发音频流的感知属性的突然改变,这样的突然改变是不希望的并因此对于实现感知连续性的目标构成问题。附图说明现在将只以举例的方式参考附图描述示例实施例,其中图1概略地示出了优选实施例的自适应混合布置的一种形式;图2示出了优选实施例的电话会议混合器;及图3示出了优选实施例的电话会议混合器的示例操作序列的时间线。图4A是示出用于从音频波形确定事件的系统的单元的示例的框图;图4B示出输入波形和可以由例如如图4A中显示的系统产生的、对应的特征和事件的示例;图5A是示出用于从音频波形确定事件的可替代性系统的单元的示例的框图;图5B示出可以被提取的特征的示例和可以由例如如图5A中显示的系统检测到的事件的示例;图6A-6C示出用于实现特征提取器和事件检测器的不同的系统拓扑。具体实施方式优选实施例在用于电话会议(带有或不带有相关联的视频流)的环境中操作。示例性音频电话会议系统在图1中被示出为1。在这个布置中,一系列的会议参加者共同提供音频输入和输出。例如,在布置1中,第一参加者2使用与计算机6互连的一对头戴式耳机5和输入麦克风3以参加会议。计算机6提供通过网络9与混合器11的上行链路8和下行链路7连接。第二组参加者例如20使用音频设备21,该音频设备21提供包括空间化信息的音频输出。该音频设备21也提供内部计算和通信能力,并包括上行链路23和下行链路24通道,该上行链路23和下行链路24通道经由网络25,26与混合器11互连。附加的参加者也可以
经由其他手段与混合器互连。图1的布置包括多个会议参加者2,该多个会议参加者2利用由双耳耳机5连同悬挂式麦克风3例示的DTX终端。所述的多个DTX终端中的每个通常经由网络9断言(assert)10DTX上行链路流8到电话会议混合器11。混合器产生用于每个DTX终端的下行链路流7,该下行链路流7通过网络9被传输回到终端2而被参加者2听到。由非手持电话设备21示例的多个CTX终端中的每个捕获另外多个会议参加者20的语音27。显著背景噪声也可以由这种设备捕获。所述的多个CTX终端中的每个通常经由网络25断言CTX上行链路流26到混合器11。不失一般性,网络25可以是与由DTX终端使用的网络相同的网络。混合器11产生用于每个CTX终端的下行链路流23,该下行链路流23被通过网络25传输回到终端21用于回放给多个参加者20。在电话会议系统中,参加者终端中的每个发送上行链本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/62/CN106031141.html" title="会议中使用改变视盲的感知连续性原文来自X技术">会议中使用改变视盲的感知连续性</a>

【技术保护点】
一种在如下类型的音频会议混合系统中的方法,该类型的音频会议混合系统取得包括混合转换事件的会议参加者的输入音频信息的多个音频输入流,并输出包括输出音频信息的多个音频输出流,该方法混合音频输出流以降低混合转换事件的可检测性,该方法包括以下步骤:(a)确定转换事件将发生;(b)确定掩蔽触发将发生;(c)安排转换事件基本上在掩蔽事件发生时发生。

【技术特征摘要】
【国外来华专利技术】2014.02.28 US 61/946,0301.一种在如下类型的音频会议混合系统中的方法,该类型的音频会议混合系统取得包括混合转换事件的会议参加者的输入音频信息的多个音频输入流,并输出包括输出音频信息的多个音频输出流,该方法混合音频输出流以降低混合转换事件的可检测性,该方法包括以下步骤:(a)确定转换事件将发生;(b)确定掩蔽触发将发生;(c)安排转换事件基本上在掩蔽事件发生时发生。2.如权利要求1所述的方法,其中所述混合转换事件包括当孤立地收听时能被收听参加者注意到的音频输入流编码中的改变。3.如前面任一权利要求所述的方法,其中所述掩蔽触发包括以下中的至少一个:语音的起始或终止;语音特性的预定的改变,或预定数目的参加者的同时语音的起始。4.如前面任一权利要求所述的混合音频输出流的方法,其中所述安排包含延迟转换事件的发生直到掩蔽触发发生。5.如前面任一权利要求所述的混合音频输出流的方法,其中所述掩蔽触发包括所述音频输入流中的一个音频输入流的语音的起始或终止。6.如前面任一权利要求所述的方法,其中掩蔽触发包含由会议参加者中的至少一个对于预定文本的发言。7.如前面任一权利要求所述的方法,其中在音频输入流中的一个音频输入流中的音量和/或预定谱流量的增加的存在指示在音频输入流中的所述一个音频输入流中的掩蔽触发。8.如权利要求3或前面任一从属于权利要求3的权利要求所述的混合音频输出流的方法,其中语音的所...

【专利技术属性】
技术研发人员:R·J·卡特莱特G·N·迪金斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1