一种语音掩蔽方法和设备技术

技术编号:15846328 阅读:34 留言:0更新日期:2017-07-18 18:39
本申请公开了一种语音掩蔽方法和设备,所述方法包括:确定目标语音帧的基音参数;根据所述基音参数,确定所述目标语音帧的掩蔽语音帧;根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽。本申请实施例提供的语音掩蔽方法和设备,能够根据目标语音帧的基音参数,确定与目标语音帧具有相同基音参数的掩蔽语音帧,使得掩蔽语音帧与目标语音帧具有相似性,利用与目标语音帧具有相似性的掩蔽语音帧对目标语音帧进行掩蔽,能够实现对目标语音帧的有效掩蔽,达到较好的掩蔽效果。

【技术实现步骤摘要】
一种语音掩蔽方法和设备
本申请涉及信息安全
,尤其涉及一种语音掩蔽方法和设备。
技术介绍
语音是人们信息交流和传递的重要载体。在很多场合,例如,会议、交谈或语音通信过程中,当谈话或语音通信中的语音中包含个人隐私、商业机密甚至是国家机密时,一旦该语音被窃听,将会给个人、企业乃至国家造成恶劣的后果。因此,保护语音的私密性至关重要。目前,主要通过噪声掩蔽法实现对语音私密性的保护,通过将被掩蔽语音与噪声的叠加,降低他人的听觉系统对被掩蔽语音的感知和辨别能力,达到保护被掩蔽语音信号的私密性的目的。但是,由于人类听觉系统具有“鸡尾酒会效应”,即可以在嘈杂声中跟踪分辨某个声音。因此,在噪声掩蔽法中,噪声常常无法满足对被掩蔽语音的有效掩蔽的要求。
技术实现思路
有鉴于此,本申请实施例提供一种语音掩蔽方法和设备,用以解决现有技术中无法满足对被掩蔽语音的有效掩蔽的要求的问题。本申请实施例提供一种语音掩蔽方法,包括:确定目标语音帧的基音参数;根据所述基音参数,确定所述目标语音帧的掩蔽语音帧;根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽。可选地,根据所述基音参数,确定所述目标语音帧的掩蔽语音帧,包括:从语料库中查找基音参数与所述基音参数相同的语音帧,并将所述语音帧确定为所述掩蔽语音帧,其中,所述语料库中包含具有不同基音参数并且帧长为预设帧长的语音帧。可选地,确定目标语音帧的基音参数,包括:通过对所述目标语音帧进行基音检测,确定所述目标语音帧的基音参数。可选地,通过以下方式确定所述目标语音帧,包括:获取目标语音;按照所述预设帧长对所述目标语音进行分帧处理,得到依时间顺序排列的目标语音帧。可选地,根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽,包括:将所述目标语音帧和所述掩蔽语音帧进行线性叠加,得到掩蔽后语音帧。可选地,所述基音参数包含基音周期或基音频率。本申请实施例还提供一种语音掩蔽设备,包括:预处理单元、确定单元和掩蔽单元,其中:预处理单元,用于确定目标语音帧的基音参数;确定单元,用于根据所述基音参数,确定所述目标语音帧的掩蔽语音帧;掩蔽单元,用于根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过确定目标语音帧的基音参数,能够根据所述目标语音帧的基音参数,确定与所述目标语音帧具有相似性的掩蔽语音帧,进而根据所述掩蔽语音帧对所述目标语音帧进行掩蔽,从而实现对目标语音帧的有效掩蔽,达到较好的掩蔽效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例提供的一种语音掩蔽方法的流程示意图;图2为本申请实施例提供的一种语音掩蔽方法的实现场景示意图;图3为本申请实施例提供的一种语音掩蔽方法的实现流程示意图;图4为本申请实施例提供的一种语音掩蔽设备的结构示意图。具体实施方式现有技术中,通过噪声掩蔽法,将被掩蔽语音与噪声的叠加,降低他人的听觉系统对被掩蔽语音的感知和辨别能力,从而实现保护被掩蔽语音信号的私密性的目的。目前,除了可以通过噪声掩蔽法实现对语音私密性的保护之外,还可以采用时间反转语音掩蔽法来保护语音的私密性。具体地,对于被掩蔽语音信号,在时域上以一定帧长进行时间反转确定时间反转信号,进而利用该时间反转信号对该被掩蔽语音信号进行掩蔽,以实现降低被掩蔽语音的辨识度,达到保护被掩蔽语音信号的私密性的目的。例如:对于被掩蔽语音信号,按照一定的帧长T进行分帧,对任一帧语音信号x(t),在时域上进行时间反转,得到其对应的时间反转信号y(t)=x(T-t),利用该帧语音信号x(t)对应的时间反转信号y(t)对该帧语音信号x(t)进行掩蔽。在采用时间反转语音掩蔽法来对被掩蔽语音进行掩蔽时,需要选择较长的帧长来保证掩蔽效果,例如,当帧长大于120ms时,才能保证掩蔽效果。但是,选择较长的帧长会给掩蔽过程带来一定的延时,影响谈话或者语音通信的效果。为了实现本申请的目的,本申请实施例提供的一种语音掩蔽方法和设备,所述方法包括:通过确定目标语音帧的基音参数,能够根据所述目标语音帧的基音参数,确定与所述目标语音帧具有相似性的掩蔽语音帧,进而根据所述掩蔽语音帧对所述目标语音帧进行掩蔽,从而实现对目标语音帧的有效掩蔽,达到较好的掩蔽效果。下面结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。实施例1图1为本申请实施例提供的一种语音掩蔽方法的流程示意图。所述方法可以如下所示。步骤101:确定目标语音帧的基音参数。在步骤101中,对于需要进行掩蔽的目标语音帧,确定其基音参数。可选地,按照预设帧长实时获取所述目标语音帧。例如,对于实时交谈过程,对交谈过程中的语音进行计时,当语音时长达到所述预设帧长时,确定所述预设帧长的语音为目标语音帧。对于实时获取得到的所述目标语音帧执行后续的处理过程。可选地,还可以通过以下方式确定所述目标语音帧,包括:获取目标语音;按照所述预设帧长对所述目标语音进行分帧处理,得到依时间顺序排列的目标语音帧。其中,所述目标语音可以是面对面交谈的语音,也可以是语音通信过程中传输的语音信号,这里不做具体限定。将所述目标语音按照所述预设帧长进行分帧处理之后,得到多个所述目标语音帧,对任一所述目标语音帧执行后续的处理过程。本申请实施例中,确定目标语音帧的基音参数,包括:通过对所述目标语音帧进行基音检测,确定所述目标语音帧的基音参数。在实际应用中,基音检测的方法有很多,例如,自相关函数法、平均幅度差函数法、小波系数法、短时平均幅度差函数法、倒谱法等。在本申请实施例中,可以采用上述任一种基音检测方法对所述目标语音帧进行基音检测,从而确定所述目标语音帧的基音参数,这里不做具体限定。本申请实施例中,所述基音参数包含基音频率或基音周期。基音频率指的是发浊音时声带震动的频率,基音频率的倒数为基音周期,在语音分析和语音处理过程中,基音频率和基音周期是语音的重要特征参数。本申请实施例中,优选地,所述预设帧长为20ms。人类语音的基音频率范围一般为70-500Hz,基音周期的变化范围一般为2-14ms。在确定所述目标语音帧时,如果所述预设帧长小于人类语音的基音周期,对于得到的所述目标语音帧,将无法检测到其基音周期或基音频率。因此,优选地,所述预设帧长为20ms。当按照所述预设帧长20ms确定所述目标语音帧之后,对于得到的所述目标语音帧,能够较好的检测到其基音周期或基音频率。同时,相对于现有技术中的时间反转语音掩蔽法中需要选择大于120ms的帧长才能保证掩蔽效果来说,本申请实施例记载的技术方案能够选择较短的帧长,降低了延时,不会影响谈话或者语音通信的实时效果。图2为本申请实施例提供的一种语音掩蔽方法的实现场景示意图。如图2所示,对于一段时长为60ms的目标语音X,按照所述预设帧长20ms对所述目标语音X进行分帧处理,得到依时间顺序排列的本文档来自技高网...
一种语音掩蔽方法和设备

【技术保护点】
一种语音掩蔽方法,其特征在于,包括:确定目标语音帧的基音参数;根据所述基音参数,确定所述目标语音帧的掩蔽语音帧;根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽。

【技术特征摘要】
1.一种语音掩蔽方法,其特征在于,包括:确定目标语音帧的基音参数;根据所述基音参数,确定所述目标语音帧的掩蔽语音帧;根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽。2.如权利要求1所述的方法,其特征在于,根据所述基音参数,确定所述目标语音帧的掩蔽语音帧,包括:从语料库中查找基音参数与所述基音参数相同的语音帧,并将所述语音帧确定为所述掩蔽语音帧,其中,所述语料库中包含具有不同基音参数并且帧长为预设帧长的语音帧。3.如权利要求2所述的方法,其特征在于,确定目标语音帧的基音参数,包括:通过对所述目标语音帧进行基音检测,确定所述目标语音帧的基音参数。4.如权利要求1-3任一项所述的方法,其特征在于,通过以下方式确定所述目标语音帧,包括:获取目标语音;按照所述预设帧长对所述目标语音进行分帧处理,得到依时间顺序排列的目标语音帧。5.如权利要求4所述的方法,其特征在于,根据所述掩蔽语音帧,对所述目标语音帧进行掩蔽,包括:将所述目标语音帧和所述掩蔽语音帧进行线性叠加,得到掩蔽后语音帧。6.如权利要求1-3任一项所述的方法,其...

【专利技术属性】
技术研发人员:丁琦南龙梅徐金甫
申请(专利权)人:中国人民解放军信息工程大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1