一种语音中声场远近自动调节技术制造技术

技术编号：39987287 阅读：19 留言：0更新日期：2024-01-09 01:59

本发明专利技术公开了语音声场调节领域的一种语音中声场远近自动调节技术，包括以下步骤：S1：对初始语音进行分段处理，对获取的初始语音进行第一分段处理和第二分段处理；S2：分析判断语音声场远近，通过音频的数值对分级处理后的语音片段进行判断，将其分为远声场、中声场以及近声场；S3：调整远声场语音强度，优先对远声场的声音片段自动进行增强处理，其次对中声场自动进行增强处理，对近声场不增强；能够增强语音转换文字的准确率，能够减少语音转文字过程中发生的漏分析、漏转换等问题，能够提升语音转换文字的效率，并提高语音转文字的准确率，能够增加语音转换文字的时间性，使其转换文字结果与时俱进，更具有时效性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音声场调节，具体为一种语音中声场远近自动调节技术。

技术介绍

1、语音转换成文字是一种计算机技术，它通过利用语音识别技术的原理，将语音信号转换成文字，可以将声音信号转换成文字，以便计算机可以理解和处理，实现语音转换文字的算法都是通过提取音频信号中的特征，使用多头注意力机制来考虑上下文信息。

2、现有的语音在转换文字的过程中，语音中声场的远近容易对其造成影响，当声场远近差别大的情况下会导致在语音转文字的过程中发生漏分析、漏转换等的问题。

3、为此我们提出一种语音中声场远近自动调节技术用于解决上述问题。

技术实现思路

1、本专利技术的目的在于提供一种语音中声场远近自动调节技术，以解决上述
技术介绍
中提出的问题。

2、为实现上述目的，本专利技术提供如下技术方案：一种语音中声场远近自动调节技术，包括以下步骤：

3、s1：对初始语音进行分段处理，对获取的初始语音进行第一分段处理和第二分段处理；

4、s2：分析判断语音声场远近，...

【技术保护点】

1.一种语音中声场远近自动调节技术，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述S1中，将初始语音从时间交错值到时间结束值依次分成若干个L1时长的语音片段，记为第一分段处理语音；第二分段处理语音的交错时间节点用公式为T初始=L1/2，其中，T初始为第二分段处理语音的初始交错时间点，L1为第一分段处理语音的语音分段时长，再次将初始语音依次分成若干个L2的语音片段，记为第二分段处理语音，其中，L1和L2的语音分段时长最大值为1min。

3.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述S...

【技术特征摘要】

1.一种语音中声场远近自动调节技术，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述s1中，将初始语音从时间交错值到时间结束值依次分成若干个l1时长的语音片段，记为第一分段处理语音；第二分段处理语音的交错时间节点用公式为t初始=l1/2，其中，t初始为第二分段处理语音的初始交错时间点，l1为第一分段处理语音的语音分段时长，再次将初始语音依次分成若干个l2的语音片段，记为第二分段处理语音，其中，l1和l2的语音分段时长最大值为1min。

3.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述s1中，通过噪音滤波器对第一分段处理、第二分段处理的语音片段进行噪音删除，删除的范围包括0-20赫兹以及10000赫兹以上。

4.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述s2中，远声场、中声场以及近声场对应的赫兹分别为：20-100赫兹、100-1000赫兹、1000-10000赫兹，对低于20赫兹的定义为无效语音片段，对无效语音片段进行删除处理。

5.根据权利要求1所述的一种语音中声场远近自动调节技术，其特征在于：在所述s3中，对远声场的音频自动进行增强，其增强的数值为处于远声场语音片段的平均赫兹数中位数与处于近声场语音片段的平均赫兹中位数的差值；对中声场自动进行增强，其增强的数值为处于中声场语音片段的平均赫兹数中位数与处于近声场语音片段的平均赫兹中位数的差值。

6.根据权利要求1所述的一种语...

【专利技术属性】
技术研发人员：刘珏廷，刘迎春，刘泽蒙，
申请(专利权)人：江苏慧言智语安全科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人