【技术实现步骤摘要】
本专利技术涉及语音声场调节,具体为一种语音中声场远近自动调节技术。
技术介绍
1、语音转换成文字是一种计算机技术,它通过利用语音识别技术的原理,将语音信号转换成文字,可以将声音信号转换成文字,以便计算机可以理解和处理,实现语音转换文字的算法都是通过提取音频信号中的特征,使用多头注意力机制来考虑上下文信息。
2、现有的语音在转换文字的过程中,语音中声场的远近容易对其造成影响,当声场远近差别大的情况下会导致在语音转文字的过程中发生漏分析、漏转换等的问题。
3、为此我们提出一种语音中声场远近自动调节技术用于解决上述问题。
技术实现思路
1、本专利技术的目的在于提供一种语音中声场远近自动调节技术,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:一种语音中声场远近自动调节技术,包括以下步骤:
3、s1:对初始语音进行分段处理,对获取的初始语音进行第一分段处理和第二分段处理;
4、s2:分析判断语音声场远近,
...【技术保护点】
1.一种语音中声场远近自动调节技术,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种语音中声场远近自动调节技术,其特征在于:在所述S1中,将初始语音从时间交错值到时间结束值依次分成若干个L1时长的语音片段,记为第一分段处理语音;第二分段处理语音的交错时间节点用公式为T初始=L1/2,其中,T初始为第二分段处理语音的初始交错时间点,L1为第一分段处理语音的语音分段时长,再次将初始语音依次分成若干个L2的语音片段,记为第二分段处理语音,其中,L1和L2的语音分段时长最大值为1min。
3.根据权利要求1所述的一种语音中声场远近自动调节技术,
...【技术特征摘要】
1.一种语音中声场远近自动调节技术,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种语音中声场远近自动调节技术,其特征在于:在所述s1中,将初始语音从时间交错值到时间结束值依次分成若干个l1时长的语音片段,记为第一分段处理语音;第二分段处理语音的交错时间节点用公式为t初始=l1/2,其中,t初始为第二分段处理语音的初始交错时间点,l1为第一分段处理语音的语音分段时长,再次将初始语音依次分成若干个l2的语音片段,记为第二分段处理语音,其中,l1和l2的语音分段时长最大值为1min。
3.根据权利要求1所述的一种语音中声场远近自动调节技术,其特征在于:在所述s1中,通过噪音滤波器对第一分段处理、第二分段处理的语音片段进行噪音删除,删除的范围包括0-20赫兹以及10000赫兹以上。
4.根据权利要求1所述的一种语音中声场远近自动调节技术,其特征在于:在所述s2中,远声场、中声场以及近声场对应的赫兹分别为:20-100赫兹、100-1000赫兹、1000-10000赫兹,对低于20赫兹的定义为无效语音片段,对无效语音片段进行删除处理。
5.根据权利要求1所述的一种语音中声场远近自动调节技术,其特征在于:在所述s3中,对远声场的音频自动进行增强,其增强的数值为处于远声场语音片段的平均赫兹数中位数与处于近声场语音片段的平均赫兹中位数的差值;对中声场自动进行增强,其增强的数值为处于中声场语音片段的平均赫兹数中位数与处于近声场语音片段的平均赫兹中位数的差值。
6.根据权利要求1所述的一种语...
【专利技术属性】
技术研发人员:刘珏廷,刘迎春,刘泽蒙,
申请(专利权)人:江苏慧言智语安全科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。