用于体育赛事系统的语音识别方法、电子设备及存储介质技术方案

技术编号:38416068 阅读:10 留言:0更新日期:2023-08-07 11:19
用于体育赛事系统的语音识别方法、电子设备及存储介质,属于智能语音识别技术领域。为解决在体育比赛中的嘈杂环境下使用语音识别技术提高语音信号的质量、准确进行语音识别。本发明专利技术采集体育赛事系统的语音信号数据,对采集的体育赛事系统的语音信号数据进行预处理,得到体育赛事系统的数字信号数据利用Mel频率倒谱系数进行特征提取,得到体育赛事系统的特征提取数据进行降噪处理,得到体育赛事系统的降噪处理数据;构建体育赛事系统的语音参考模式库;将得到的体育赛事系统的降噪处理数据利用构建的体育赛事系统的语音参考模式库进行体育赛事系统的语音识别。本发明专利技术提高语音信号质量,解决了语音识别过程中存在的噪声环境下识别率低的问题。识别率低的问题。识别率低的问题。

【技术实现步骤摘要】
用于体育赛事系统的语音识别方法、电子设备及存储介质


[0001]本专利技术属于智能语音识别
,具体涉及用于体育赛事系统的语音识别方法、电子设备及存储介质。

技术介绍

[0002]语音识别与其他生物识别技术相比,不仅具有不会遗失和忘记、不需记忆、使用方便等特点,而且还具有使用者接受程度高,声音输入设备造价低廉等优点,可利用通话设备(如:手机)进行语音特征提取,采集数据不受限制。由于涉及不到使用者的隐私问题,所以可以方便的推广应用。
[0003]随着科学技术的发展和进步,语音识别技术取得了显著的进步,“人机交互”的概念已经广泛应用于体育赛事、通信、智能家电、医疗等各个领域。语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,实现人机交互逐渐从键盘、鼠标等传统的人工输入方式中解放出来。最终目的是实现人与机器进行自然语言通信,用语言操纵机器。技术统计工作是体育赛事的重要组成部分,在评估每场比赛的水平,服务于运动队,有针对性的改进和提高训练水平上起到非常重要的作用。因此,亟需充分利用语音识别技术,实现保障体育赛事技统工作的实用性、友好性、高体验性、自动化和智能化。

技术实现思路

[0004]本专利技术要解决的问题是在体育比赛中的嘈杂环境下使用语音识别技术提高语音信号的质量、准确进行语音识别,提出用于体育赛事系统的语音识别方法、电子设备及存储介质。
[0005]为实现上述目的,本专利技术通过以下技术方案实现:
[0006]一种用于体育赛事系统的语音识别方法,包括如下步骤:
[0007]S1、采集体育赛事系统的语音信号数据,对采集的体育赛事系统的语音信号数据进行预处理,得到体育赛事系统的数字信号数据;
[0008]步骤S1的具体实现方法包括如下步骤:
[0009]S1.1、用具有6dB/倍频程提升高频特性的预加重数字滤波器将采集体育赛事系统的语音信号数据进行预加重处理,预加重处理的计算表达式为:
[0010]H(z)=1

αz^(

1);
[0011]其中,α为传递系数,H(z)为传递函数,z为预加重系数;
[0012]S1.2、将步骤S1.1预加重处理的体育赛事系统的语音信号数据采用汉明窗进行分帧加窗,分帧加窗的计算表达式为:
[0013][0014]其中,γ为预加重处理的体育赛事系统的语音信号数据长度,β为汉明窗宽度,W
(γ)为窗函数;
[0015]S1.3、对步骤S1.2分帧加窗后的体育赛事系统的语音信号数据进行短时过零率检测,利用短时能量检测浊音,利用短时过零率检测清音,短时能量检测的计算表达式为:
[0016][0017]其中,X
n
(m)为第n段第m帧语音分帧加窗后的体育赛事系统的语音信号数据,N为语音里帧总数,m为第m帧语音,E
n
为语音幅度值变化函数;
[0018]短时过零率检测的计算表达式为:
[0019][0020]其中,ZCR(n)为短时过零率函数,X
n
(m+1)为第n段第m+1帧语音分帧加窗后的体育赛事系统的语音信号数据;
[0021]S2、将步骤S1得到的体育赛事系统的数字信号数据利用Mel频率倒谱系数进行特征提取,得到体育赛事系统的特征提取数据;
[0022]S3、将步骤S2得到的体育赛事系统的特征提取数据进行降噪处理,得到体育赛事系统的降噪处理数据;
[0023]S4、构建体育赛事系统的语音参考模式库;
[0024]S5、将步骤S3得到的体育赛事系统的降噪处理数据输入到步骤S4构建的体育赛事系统的语音参考模式库中,进行体育赛事系统的语音识别。
[0025]进一步的,步骤S2的具体实现方法包括如下步骤:
[0026]S2.1、通过离散傅里叶变换得到Mel频率倒谱系数C
n
,计算表达式为:
[0027][0028]其中,logx`(k)为求k对数函数的一阶导数,k为离散傅里叶变换长度,M为滤波器的个数,n为Mel频率倒谱系数的个数;
[0029]S2.2、根据步骤S2.1得到的Mel频率倒谱系数,对步骤S1得到的体育赛事系统的数字信号数据计算一阶和二阶差分参数,进行特征提取,计算表达式为:
[0030][0031]其中,d(n)为体育赛事系统的特征提取数据,为语音帧长,为影响语音识别性能系数。
[0032]进一步的,步骤S3的具体实现方法包括如下步骤:
[0033]S3.1、设置步骤S2得到的体育赛事系统的特征提取数据的长度为μ,将步骤S2得到的体育赛事系统的特征提取数据设置为高斯金字塔底层语音信号,构建高斯金字塔语音信号进行语音信号的分解,计算表达式为:
[0034][0035]其中,I
D
(x)为第D层高斯金字塔语音信号x的幅度值,x为语音信号数据,I
D
‑1(2x+μ)为滤波模板,c(μ)为滤波函数,b为高斯金字塔的总层数;
[0036]S3.2、生成高斯金字塔:I
D
为第D层高斯金字塔语音信号幅度值,I0为最底层高斯金字塔语音信号幅度值,首先对I
D
进行DCNN5*5卷积,然后进行下采样操作,得到I
D+1
的滤波函数c(μ)取值为:
[0037][0038]S3.3、将步骤S3.2得到的高斯金字塔语音信号进行重构,计算表达式为:
[0039][0040]其中,DF
D
为第D层语音信号的拉普拉斯金字塔分量;
[0041]S3.4、在步骤S3.3重构的基础上,采用积分平均法消除重构中产生的随机噪声,得到体育赛事系统的降噪处理数据,计算表达式为:
[0042][0043]其中,为体育赛事系统的降噪处理数据的实际值,s(x)为体育赛事系统的降噪处理数据的理想值,h
a
(x)为体育赛事系统的降噪处理数据的随机噪声,L为取语音信号长度,l为随机噪声长度。
[0044]进一步的,步骤S4的具体实现方法为预先录制参考模式语音文件样本,通过利用语音识别的预处理以及特征提取,对参考模式语音文件样本进行语音识别,然后将进行语音识别的参考模式语音文件样本作为模型存储,得到体育赛事系统的语音参考模式库。
[0045]进一步的,步骤S5的具体实现方法包括如下步骤:
[0046]S5.1、设置步骤S3得到的降噪处理数据为待识别矢量,具有I帧矢量,步骤S4构建的体育赛事系统的语音参考模式库中的数据为模板矢量,具有J帧矢量,且I和J不相等;
[0047]S5.2、设置时间规整函数j=w(i),将待识别矢量的时间轴i非线性地映射到模板的时间轴j上,且函数w(i)的计算表达式为:
[0048][0049]其中,d[T(i),R(w(i))]为第i帧待识别矢量T(i)和第j帧模板矢量R(w(i))本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于体育赛事系统的语音识别方法,其特征在于,包括如下步骤:S1、采集体育赛事系统的语音信号数据,对采集的体育赛事系统的语音信号数据进行预处理,得到体育赛事系统的数字信号数据;步骤S1的具体实现方法包括如下步骤:S1.1、用具有6dB/倍频程提升高频特性的预加重数字滤波器将采集体育赛事系统的语音信号数据进行预加重处理,预加重处理的计算表达式为:H(z)=1

αz^(

1);其中,α为传递系数,H(z)为传递函数,z为预加重系数;S1.2、将步骤S1.1预加重处理的体育赛事系统的语音信号数据采用汉明窗进行分帧加窗,分帧加窗的计算表达式为:其中,γ为预加重处理的体育赛事系统的语音信号数据长度,β为汉明窗宽度,W(γ)为窗函数;S1.3、对步骤S1.2分帧加窗后的体育赛事系统的语音信号数据进行短时过零率检测,利用短时能量检测浊音,利用短时过零率检测清音,短时能量检测的计算表达式为:其中,X
n
(m)为第n段第m帧语音分帧加窗后的体育赛事系统的语音信号数据,N为语音里帧总数,m为第m帧语音,E
n
为语音幅度值变化函数;短时过零率检测的计算表达式为:其中,ZCR(n)为短时过零率函数,X
n
(m+1)为第n段第m+1帧语音分帧加窗后的体育赛事系统的语音信号数据;S2、将步骤S1得到的体育赛事系统的数字信号数据利用Mel频率倒谱系数进行特征提取,得到体育赛事系统的特征提取数据;S3、将步骤S2得到的体育赛事系统的特征提取数据进行降噪处理,得到体育赛事系统的降噪处理数据;S4、构建体育赛事系统的语音参考模式库;S5、将步骤S3得到的体育赛事系统的降噪处理数据利用步骤S4构建的体育赛事系统的语音参考模式库中,进行体育赛事系统的语音识别。2.根据权利要求1所述的一种用于体育赛事系统的语音识别方法,其特征在于,步骤S2的具体实现方法包括如下步骤:S2.1、通过离散傅里叶变换得到Mel频率倒谱系数C
n
,计算表达式为:
其中,logx`(k)为求k对数函数的一阶导数,k为离散傅里叶变换长度,M为滤波器的个数,n为Mel频率倒谱系数的个数;S2.2、根据步骤S2.1得到的Mel频率倒谱系数,对步骤S1得到的体育赛事系统的数字信号数据计算一阶和二阶差分参数,进行特征提取,计算表达式为:其中,d(n)为体育赛事系统的特征提取数据,为语音帧长,为影响语音识别性能系数。3.根据权利要求2所述的一种用于体育赛事系统的语音识别方法,其特征在于,步骤S3的具体实现方法包括如下步骤:S3.1、设置步骤S2得到的体育赛事系统的特征提取数据的长度为μ,将步骤S2得到的体育赛事系统的特征提取数据设置为高斯金字塔底层语音信号,构建高斯金字塔语音信号进行语音信号的分解,计算表达式为:其中,I
D
...

【专利技术属性】
技术研发人员:曲艳
申请(专利权)人:黑龙江省芯网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1