当前位置: 首页 > 专利查询>武汉大学专利>正文

一种实时语音通信的清晰度增强方法及系统技术方案

技术编号:17009795 阅读:72 留言:0更新日期:2018-01-11 06:02
本发明专利技术属于语音信号处理与通信技术领域,公开了一种实时语音通信的清晰度增强方法及系统,系统包括:语音信号修正模块、噪声波形抵消模块、综合调整模块。方法包括:获取感知参数、语音信号和噪声信号,对语音信号进行修正处理,得到已修正语音信号;获取噪声信号,对噪声信号进行噪音波形抵消处理,得到预测噪声信号;对已修正语音信号和预测噪声信号进行综合调整,得到清晰度增强信号。本发明专利技术解决了现有技术中语音清晰度提升不足的问题,达到了在实现语音清晰度增强的同时,最大程度地降低系统硬件成本的技术效果。

【技术实现步骤摘要】
一种实时语音通信的清晰度增强方法及系统
本专利技术涉及语音信号处理与通信
,尤其涉及一种实时语音通信的清晰度增强方法及系统。
技术介绍
20世纪末,绝大多数语音通信终端位于室内座机电话或电话亭中,通过空间隔绝的方式减少噪声对语音信号的干扰;随着21世纪移动通信技术的快速发展,人们可以随时随地通过移动终端进行语音通信,而不同场景下的多样化环境噪声对通话者接收到语音的清晰度带来了严重的干扰。有噪环境下的语音通信划分为两个过程:(1)处于有噪环境中说话者,对通信终端输入了一段语音,终端麦克风采集到了语音信号,同时还采集到了环境噪声信号;(2)处于有噪环境中听音者,从移动终端扬声器或耳机接收到输出的语音信号,同时人耳还接收到环境中的噪声信号。针对过程(1)中麦克风采集到含有噪声的语音信号这种情况,将有噪语音信号中的噪声滤除,称为远端语音增强技术;针对过程(2)中人耳接收到语音信号的同时接收到噪声的情况,调整移动终端扬声器的输出信号,称为语音清晰度增强技术或近场听音增强技术。为了提高语音清晰度,传统方法采用统一标准修改语音信号的方式,通过改变语音信号的感知声学特性和能量掩蔽噪声。年龄、性别等因素都会改变一个人对语音清晰度判断的标准,采用统一标准修正信号可能导致对部分人群的清晰度提升不足或因过度修正使音调改变降低听觉感受。除了采用语音修正的方法,还有通过主动降噪的方式提高语音清晰度,主动降噪技术是利用附加声源生成噪声抵消信号,根据噪声波形产生与原始噪声信号振幅相等、相位相反的信号,使两者波形相互抵消。主动降噪的方法优势明显,但主要的主动降噪系统却仍然主要针对的是头戴式耳机且价格昂贵。传统的主动噪声抵消算法主要使用自适应滤波的预测噪声的方法,而噪声具有一定的随机性,传统的数字信号处理的方法在噪声变化周期性较弱时滤波效果明显下降;同时,移动终端大多采用单麦克风设计,在没有双麦克风组成反馈系统的情况下,采用数字信号处理的方式预测噪声误差较大。综上,使用传统方法修正信号可能导致清晰度提升不足或因过度修正使音调改变降低听觉感受;使用传统方法预测噪声在抵消一部分噪声的同时也会引入很多新的噪声,对清晰度的提升十分有限。同时,语音修正和主动降噪作为提升语音清晰度的两大关键技术,但往往被分离开来单独研究和设计,这不利于两项技术在语音通信中的联合使用。
技术实现思路
本申请实施例通过提供一种实时语音通信的清晰度增强方法及系统,解决了现有技术中语音清晰度提升不足的问题。本申请实施例提供一种实时语音通信的清晰度增强系统,包括:语音信号修正模块、噪声波形抵消模块、综合调整模块;所述语音信号修正模块用于根据输入的感知参数、语音信号和噪声信号,输出已修正语音信号;所述噪声波形抵消模块用于根据输入的噪声信号,输出预测噪声信号;所述综合调整模块用于根据输入的所述已修正语音信号和所述预测噪声信号,输出清晰度增强信号。优选的,所述语音信号修正模块包括:清晰度估计模型选择模块、语音清晰度估计模块、语音特性调整模块;所述清晰度估计模型选择模块用于根据所述感知参数生成清晰度估计模型标号,并根据所述清晰度估计模型标号在清晰度估计模型数据库中提取对应的清晰度估计模型,所述清晰度估计模型包括清晰度估计函数和清晰度修正函数;所述语音清晰度估计模块用于将输入的语音信号和噪声信号进行子带划分,根据子带划分后的语音信号和噪声信号、所述清晰度估计函数得到清晰度估计值;所述语音特性调整模块用于根据所述清晰度估计值和所述清晰度修正函数得到所述已修正语音信号。优选的,所述噪声波形抵消模块包括:噪声场景判别模块、噪声波形预测模块;所述噪声场景判别模块用于提取所述噪声信号的噪声场景特征,并根据所述噪声场景特征选择所述噪声信号对应的场景类型;所述噪声波形预测模块用于根据所述场景类型选择对应的神经网络预测模型,所述神经网络预测模型根据所述噪声信号生成所述预测噪声信号。优选的,所述综合调整模块对所述预测噪声信号进行反相处理生产噪声波形抵消信号,并根据所述已修正语音信号和所述噪声波形抵消信号对应的增益因子生成所述清晰度增强信号。优选的,所述感知参数包括用户的年龄、性别、听力障碍等级、耳廓尺寸。本申请实施例提供一种实时语音通信的清晰度增强方法,包括:获取感知参数、语音信号和噪声信号,对所述语音信号进行修正处理,得到已修正语音信号;获取噪声信号,对所述噪声信号进行噪音波形抵消处理,得到预测噪声信号;对所述已修正语音信号和所述预测噪声信号进行综合调整,得到清晰度增强信号。优选的,根据所述感知参数生成清晰度估计模型标号,并根据所述清晰度估计模型标号在清晰度估计模型数据库中提取对应的清晰度估计模型,所述清晰度估计模型包括清晰度估计函数和清晰度修正函数;对所述语音信号和所述噪声信号进行子带划分,根据子带划分后的语音信号和噪声信号、所述清晰度估计函数得到清晰度估计值;根据所述清晰度估计值和所述清晰度修正函数得到所述已修正语音信号。优选的,提取所述噪声信号的噪声场景特征,并根据所述噪声场景特征选择所述噪声信号对应的场景类型;根据所述场景类型选择对应的神经网络预测模型,所述神经网络预测模型根据所述噪声信号得到所述预测噪声信号。优选的,对所述预测噪声信号进行反相处理生产噪声波形抵消信号,并根据所述已修正语音信号和所述噪声波形抵消信号对应的增益因子生成清晰度增强信号。优选的,所述感知参数包括用户的年龄、性别、听力障碍等级、耳廓尺寸。本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:在本申请实施例中,结合语音信号调制和噪声波形抵消两大技术,利用通信终端自身硬件设备,仅需要单麦克风和单扬声器,便能有效提高通信过程中听音环节的语音清晰度,达到在实现语音清晰度增强的同时,最大程度地降低系统硬件成本的技术效果。附图说明为了更清楚地说明本实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种实时语音通信的清晰度增强系统的总体结构示意图;图2为本专利技术实施例提供的一种实时语音通信的清晰度增强系统中语音信号修正的示意图;图3为本专利技术实施例提供的一种实时语音通信的清晰度增强系统中噪声波形抵消的示意图。具体实施方式本申请实施例通过提供一种实时语音通信的清晰度增强系统,解决了现有技术中语音清晰度提升不足的问题。本申请实施例的技术方案为解决上述技术问题,总体思路如下:一种实时语音通信的清晰度增强系统,包括:语音信号修正模块、噪声波形抵消模块、综合调整模块;所述语音信号修正模块用于根据输入的感知参数、语音信号和噪声信号,输出已修正语音信号;所述噪声波形抵消模块用于根据输入的噪声信号,输出预测噪声信号;所述综合调整模块用于根据输入的所述已修正语音信号和所述预测噪声信号,输出清晰度增强信号。一种实时语音通信的清晰度增强方法,包括:获取感知参数、语音信号和噪声信号,对所述语音信号进行修正处理,得到已修正语音信号;获取噪声信号,对所述噪声信号进行噪音波形抵消处理,得到预测噪声信号;对所述已修正语音信号和所述预测噪声信号进行综合调整,得本文档来自技高网
...
一种实时语音通信的清晰度增强方法及系统

【技术保护点】
一种实时语音通信的清晰度增强系统,其特征在于,包括:语音信号修正模块、噪声波形抵消模块、综合调整模块;所述语音信号修正模块用于根据输入的感知参数、语音信号和噪声信号,输出已修正语音信号;所述噪声波形抵消模块用于根据输入的噪声信号,输出预测噪声信号;所述综合调整模块用于根据输入的所述已修正语音信号和所述预测噪声信号,输出清晰度增强信号。

【技术特征摘要】
1.一种实时语音通信的清晰度增强系统,其特征在于,包括:语音信号修正模块、噪声波形抵消模块、综合调整模块;所述语音信号修正模块用于根据输入的感知参数、语音信号和噪声信号,输出已修正语音信号;所述噪声波形抵消模块用于根据输入的噪声信号,输出预测噪声信号;所述综合调整模块用于根据输入的所述已修正语音信号和所述预测噪声信号,输出清晰度增强信号。2.根据权利要求1所述的实时语音通信的清晰度增强系统,其特征在于,所述语音信号修正模块包括:清晰度估计模型选择模块、语音清晰度估计模块、语音特性调整模块;所述清晰度估计模型选择模块用于根据所述感知参数生成清晰度估计模型标号,并根据所述清晰度估计模型标号在清晰度估计模型数据库中提取对应的清晰度估计模型,所述清晰度估计模型包括清晰度估计函数和清晰度修正函数;所述语音清晰度估计模块用于将输入的语音信号和噪声信号进行子带划分,根据子带划分后的语音信号和噪声信号、所述清晰度估计函数得到清晰度估计值;所述语音特性调整模块用于根据所述清晰度估计值和所述清晰度修正函数得到所述已修正语音信号。3.根据权利要求1所述的实时语音通信的清晰度增强系统,其特征在于,所述噪声波形抵消模块包括:噪声场景判别模块、噪声波形预测模块;所述噪声场景判别模块用于提取所述噪声信号的噪声场景特征,并根据所述噪声场景特征选择所述噪声信号对应的场景类型;所述噪声波形预测模块用于根据所述场景类型选择对应的神经网络预测模型,所述神经网络预测模型根据所述噪声信号生成所述预测噪声信号。4.根据权利要求1所述的实时语音通信的清晰度增强系统,其特征在于,所述综合调整模块对所述预测噪声信号进行反相处理生产噪声波形抵消信号,并根据所述已修正语音信号和所述...

【专利技术属性】
技术研发人员:胡瑞敏李罡程枫王晓晨
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1