基于蛙人对讲的语音质量增强方法技术

技术编号:38511152 阅读:5 留言:0更新日期:2023-08-19 16:55
基于蛙人对讲的语音质量增强方法,涉及语音通信技术领域,获取蛙人的语音特征并录入语音库中,根据蛙人的语音识别信息建立双向信息传输通道,并根据双向信息传输通道距离确定不同语音传输距离的噪声信号在含噪语音信号中所占比例;并设置语音清晰度的评价指标;预先设置蛙人通信目标期望语音清晰度评价指标,并根据通信过程中的语音清晰度与期望语音清晰度评价指标的比较结果动态调整平均窗函数长度,并基于人耳声音频率掩蔽特征对含噪语音设置频率门限,获取经过频率门限过滤的含噪语音的语音特征输入至语音播报端中,语音播报端根据语音特征生成符合蛙人期望通信目标语音清晰度的语音信息显著地提高了蛙人对讲场景下的语音质量。的语音质量。的语音质量。

【技术实现步骤摘要】
基于蛙人对讲的语音质量增强方法


[0001]本专利技术涉及语音通信
,具体是基于蛙人对讲的语音质量增强方法。

技术介绍

[0002]蛙人对讲是指在水下进行的语音通讯,由于水的密度高和声音传播的特性等原因,水下通讯常常会受到许多干扰,导致语音质量变差,影响交流效果,语音增强是解决噪声污染的一种有效方法,它是从带噪语音信号中提取尽可能纯净的原始语音,总的来说语音增强的目标主要有:改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳;提高语音可懂度,方便听者理解。
[0003]而现有的语音通信在水中工作时,随着蛙人之间通信距离的增加,蛙人语音通信在水中进行传输的过程受到环境因素的影响也会随着通信距离的增加而越专利技术显,而现有的蛙人通信传输技术中,对蛙人传输的含噪语音进行语音增强时,将含噪语音转换为语音特征的过程中,现有技术只是将含噪语音按照固定窗函数长度对含噪语音进行语音特征的转换,忽略了水下通信过程的复杂性,没有考虑到随着蛙人之间通信距离的逐渐增加,噪声信号的复杂程度也越来越高,如果仍按照固定窗函数长度对含噪语音进行语音特征的转换,则转换的语音特征不能完整地表达含噪语音的特征,如何随着蛙人之间通信距离的逐渐增加选用不同的窗函数长度从而完整地表达含噪语音的特征是我们亟需解决的问题。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供基于蛙人对讲的语音质量增强方法,包括以下步骤:步骤S1:获取多组蛙人的纯净语音样本数据和多组蛙人在蛙人对讲场景下传输的含噪语音样本数据并录入语音库中;步骤S2:根据所述纯净语音样本数据与含噪语音样本数据生成蛙人的语音特征,获取蛙人的身份信息,将蛙人的语音特征与身份信息进行绑定生成语音识别信息;步骤S3:建立蛙人通信平台,当蛙人提出语音通信请求时,根据蛙人的语音识别信息建立双向信息传输通道,并根据双向信息传输通道距离确定不同语音传输距离的噪声信号在含噪语音信号中所占比例;并根据噪声信号在含噪语音信号中所占比例设置语音清晰度的评价指标;步骤S4:预先设置蛙人通信目标期望语音清晰度评价指标,并根据通信过程中的语音清晰度与期望语音清晰度评价指标的比较结果动态调整含噪语音转换成语音特征过程中进行加窗处理时的平均窗函数长度,并基于人耳声音频率掩蔽特征对含噪语音设置频率门限,对含噪语音的频率信号进行过滤,获取经过频率门限过滤的含噪语音的语音特征输入至语音播报端中,语音播报端根据语音特征生成符合蛙人期望通信目标语音清晰度的语音信息。
[0005]进一步的,根据所述纯净语音样本数据与含噪语音样本数据生成蛙人的语音特征
的过程包括:将所述样本数据转换成数字语音信号,并利用大数据获取所述样本数据在蛙人对讲场景时的平均分帧参数、窗函数类型和平均窗函数长度,所述平均分帧参数包括平均帧长、平均帧移,根据平均分帧参数将数字语音信号划分为若干帧,并根据窗函数对每个帧进行加窗处理,随后将每一帧的数字语音信号经过傅里叶变换转换为频率信号,随后将每一帧的频率信号经过傅里叶逆变换转换为时域波形,并将所述样本数据的时域波形标记为语音特征。
[0006]进一步的,建立蛙人通信平台,当蛙人提出语音通信请求时,根据蛙人的语音识别信息建立双向信息传输通道的过程包括:构建蛙人通信平台,当所述蛙人通信平台接收到蛙人的语音通信请求时,根据蛙人的语音通信请求确定蛙人通信目标,并根据蛙人的语音识别信息在所述蛙人与蛙人通信目标之间建立双向信息传输通道,蛙人与蛙人通信目标通过所述双向信息传输通道传输语音。
[0007]进一步的,获取双向信息传输通道语音传输距离的过程包括:所述蛙人携带有位置信号发生设备;根据位置信号发生设备产生的位置信息确定各个蛙人之间的实时距离值;根据蛙人之间的实时距离值确定蛙人与蛙人通信目标之间双向信息传输通道语音传输距离并将双向信息传输通道语音传输距离实时录入语音库中。
[0008]进一步的,根据双向信息传输通道距离确定不同语音传输距离的噪声信号在含噪语音信号中所占比例的过程包括:根据语音库获取历史若干蛙人对讲场景下多组蛙人通过双向信息传输通道进行语音传输过程的含噪语音样本数据和双向信息传输通道语音传输距离;所述含噪语音包括纯净语音信号和噪声信号;对不同双向信息传输通道语音传输距离内的含噪语音进行噪声信号的数据挖掘,以噪声信号和双向信息传输通道语音传输距离作为输入特征,噪声信号在不同双向信息传输通道语音传输距离的分布概率作为输出标签构建含噪语音概率分布函数模型;根据所述含噪语音概率分布函数模型获取在不同双向信息传输通道语音传输距离时的噪声信号在含噪语音中所占比例。
[0009]进一步的,根据噪声信号在含噪语音信号中所占比例设置语音清晰度的评价指标的过程包括:利用大数据方法获取噪声信号在含噪语音中的所占比例相对应的语音清晰度的评价指标,所述评价指标包括纯净、清晰、一般和较差;设置评价指标的指标权重,根据噪声信号在含噪语音中所占比例相对应的语音清晰度的评价指建立关于语音清晰度的评价指标矩阵,并根据噪声信号在含噪语音中的所占比例建立噪声比例矩阵,通过模糊综合评价获取噪声信号在含噪语音中所占比例对于语音清晰度的隶属度矩阵;根据隶属度矩阵及指标权重获取噪声信号在含噪语音中的不同所占比例所对应的语音清晰度。
[0010]进一步的,根据通信过程中的语音清晰度与期望语音清晰度评价指标的比较结果动态调整含噪语音转换成语音特征过程中进行加窗处理时的平均窗函数长度的量化过程包括:
预先设置蛙人通信目标期望语音清晰度评价指标,获取获取蛙人与蛙人通信目标之间所述双向信息传输通道中蛙人通信目标接收的蛙人含噪语音信号和双向信息传输通道语音传输距离;将双向信息传输通道语音传输距离和接收的蛙人含噪语音信号作为输入特征输入含噪语音概率分布函数模型获取当前双向信息传输通道语音传输距离的噪声信号在含噪语音信号中所占比例,并根据所述蛙人含噪语音信号中噪声信号在含噪语音中所占比例获取该蛙人含噪语音信号的语音清晰度评价指标;将蛙人通信目标期望语音清晰度评价指标与蛙人通信目标接收的含噪语音信号的语音清晰度评价指标进行比较,当期望语音清晰度评价指标与接收的含噪语音信号的语音清晰度评价指标不一致时,获取期望语音清晰度评价指标所对应的噪声信号在含噪语音中的所占比例与接收的含噪语音信号中噪声信号在含噪语音中所占比例的噪声比例偏差值,根据所述噪声比例偏差值获取将接收的含噪语音信号在转换成语音特征过程中进行加窗处理时的平均窗函数长度;所述含噪语音信号中噪声信号所占比例越大,则平均窗函数长度越短。
[0011]进一步的,基于人耳声音频率掩蔽特征对含噪语音设置频率门限的过程包括:利用大数据获取人耳声音频率掩蔽特征,所述人耳声音频率掩蔽特征包括人耳能够感知的最高声音频率和最低声音频率,将所述最高声音频率和最低声音频率作为步骤S2中生成频率信号时的最高门限和最低门限对所述频率信号进行过滤,滤除高于最高门限的频率信号和低于最低门限的频率信号,并将过滤后的频率信号经过傅里叶逆变换转换为时域波形,并将时域波形标记为语音特征输入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于蛙人对讲的语音质量增强方法,其特征在于,包括以下步骤:步骤S1:获取多组蛙人的纯净语音样本数据和多组蛙人在蛙人对讲场景下传输的含噪语音样本数据并录入语音库中;步骤S2:根据所述纯净语音样本数据与含噪语音样本数据生成蛙人的语音特征,获取蛙人的身份信息,将蛙人的语音特征与身份信息进行绑定生成语音识别信息;步骤S3:建立蛙人通信平台,当蛙人提出语音通信请求时,根据蛙人的语音识别信息建立双向信息传输通道,并根据双向信息传输通道距离确定不同语音传输距离的噪声信号在含噪语音信号中所占比例;并根据噪声信号在含噪语音信号中所占比例设置语音清晰度的评价指标;步骤S4:预先设置蛙人通信目标期望语音清晰度评价指标,并根据通信过程中的语音清晰度与期望语音清晰度评价指标的比较结果动态调整含噪语音转换成语音特征过程中进行加窗处理时的平均窗函数长度,并基于人耳声音频率掩蔽特征对含噪语音设置频率门限,对含噪语音的频率信号进行过滤,获取经过频率门限过滤的含噪语音的语音特征输入至语音播报端中,语音播报端根据语音特征生成符合蛙人期望通信目标语音清晰度的语音信息。2.根据权利要求1所述的基于蛙人对讲的语音质量增强方法,其特征在于,根据所述纯净语音样本数据与含噪语音样本数据生成蛙人的语音特征的过程包括:将所述样本数据转换成数字语音信号,并利用大数据获取所述样本数据在蛙人对讲场景时的平均分帧参数、窗函数类型和平均窗函数长度,所述平均分帧参数包括平均帧长、平均帧移,根据平均分帧参数将数字语音信号划分为若干帧,并根据窗函数对每个帧进行加窗处理,随后将每一帧的数字语音信号经过傅里叶变换转换为频率信号,随后将每一帧的频率信号经过傅里叶逆变换转换为时域波形,并将所述样本数据的时域波形标记为语音特征。3.根据权利要求2所述的基于蛙人对讲的语音质量增强方法,其特征在于,建立蛙人通信平台,当蛙人提出语音通信请求时,根据蛙人的语音识别信息建立双向信息传输通道的过程包括:构建蛙人通信平台,当所述蛙人通信平台接收到蛙人的语音通信请求时,根据蛙人的语音通信请求确定蛙人通信目标,并根据蛙人的语音识别信息在所述蛙人与蛙人通信目标之间建立双向信息传输通道,蛙人与蛙人通信目标通过所述双向信息传输通道传输语音。4.根据权利要求3所述的基于蛙人对讲的语音质量增强方法,其特征在于,获取双向信息传输通道语音传输距离的过程包括:所述蛙人携带有位置信号发生设备;根据位置信号发生设备产生的位置信息确定各个蛙人之间的实时距离值;根据蛙人之间的实时距离值确定蛙人与蛙人通信目标之间双向信息传输通道语音传输距离并将双向信息传输通道语音传输距离实时录入语音库中。5.根据权利要求4所述的基于蛙人对讲的语音质量增强方法,其特征在于,根据双向信息传输通道距离确定不同语音传输距离的噪声信号在含噪语音信号中所占比例的过程包括:根据语音库获取历史若干蛙人对讲场景下多组蛙人通过双向信息传输通道进行语音传输过程的含噪语音样本数据和双向信息传输通道语音传输距离;所述含噪语音包括纯净
...

【专利技术属性】
技术研发人员:王银畦王涛
申请(专利权)人:山东贝宁电子科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1