【技术实现步骤摘要】
用于体育赛事系统的语音识别方法、电子设备及存储介质
[0001]本专利技术属于智能语音识别
,具体涉及用于体育赛事系统的语音识别方法、电子设备及存储介质。
技术介绍
[0002]语音识别与其他生物识别技术相比,不仅具有不会遗失和忘记、不需记忆、使用方便等特点,而且还具有使用者接受程度高,声音输入设备造价低廉等优点,可利用通话设备(如:手机)进行语音特征提取,采集数据不受限制。由于涉及不到使用者的隐私问题,所以可以方便的推广应用。
[0003]随着科学技术的发展和进步,语音识别技术取得了显著的进步,“人机交互”的概念已经广泛应用于体育赛事、通信、智能家电、医疗等各个领域。语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,实现人机交互逐渐从键盘、鼠标等传统的人工输入方式中解放出来。最终目的是实现人与机器进行自然语言通信,用语言操纵机器。技术统计工作是体育赛事的重要组成部分,在评估每场比赛的水平,服务于运动队,有针对性的改进和提高训练水平上起到非常重要的作用。因此,亟需充分利用语音识别技术,实现保障体育赛事技统工作的实用性、友好性、高体验性、自动化和智能化。
技术实现思路
[0004]本专利技术要解决的问题是在体育比赛中的嘈杂环境下使用语音识别技术提高语音信号的质量、准确进行语音识别,提出用于体育赛事系统的语音识别方法、电子设备及存储介质。
[0005]为实现上述目的,本专利技术通过以下技术方案实现:
[0006]一种用于体育赛事系统的语音识 ...
【技术保护点】
【技术特征摘要】
1.一种用于体育赛事系统的语音识别方法,其特征在于,包括如下步骤:S1、采集体育赛事系统的语音信号数据,对采集的体育赛事系统的语音信号数据进行预处理,得到体育赛事系统的数字信号数据;步骤S1的具体实现方法包括如下步骤:S1.1、用具有6dB/倍频程提升高频特性的预加重数字滤波器将采集体育赛事系统的语音信号数据进行预加重处理,预加重处理的计算表达式为:H(z)=1
‑
αz^(
‑
1);其中,α为传递系数,H(z)为传递函数,z为预加重系数;S1.2、将步骤S1.1预加重处理的体育赛事系统的语音信号数据采用汉明窗进行分帧加窗,分帧加窗的计算表达式为:其中,γ为预加重处理的体育赛事系统的语音信号数据长度,β为汉明窗宽度,W(γ)为窗函数;S1.3、对步骤S1.2分帧加窗后的体育赛事系统的语音信号数据进行短时过零率检测,利用短时能量检测浊音,利用短时过零率检测清音,短时能量检测的计算表达式为:其中,X
n
(m)为第n段第m帧语音分帧加窗后的体育赛事系统的语音信号数据,N为语音里帧总数,m为第m帧语音,E
n
为语音幅度值变化函数;短时过零率检测的计算表达式为:其中,ZCR(n)为短时过零率函数,X
n
(m+1)为第n段第m+1帧语音分帧加窗后的体育赛事系统的语音信号数据;S2、将步骤S1得到的体育赛事系统的数字信号数据利用Mel频率倒谱系数进行特征提取,得到体育赛事系统的特征提取数据;S3、将步骤S2得到的体育赛事系统的特征提取数据进行降噪处理,得到体育赛事系统的降噪处理数据;S4、构建体育赛事系统的语音参考模式库;S5、将步骤S3得到的体育赛事系统的降噪处理数据利用步骤S4构建的体育赛事系统的语音参考模式库中,进行体育赛事系统的语音识别。2.根据权利要求1所述的一种用于体育赛事系统的语音识别方法,其特征在于,步骤S2的具体实现方法包括如下步骤:S2.1、通过离散傅里叶变换得到Mel频率倒谱系数C
n
,计算表达式为:
其中,logx`(k)为求k对数函数的一阶导数,k为离散傅里叶变换长度,M为滤波器的个数,n为Mel频率倒谱系数的个数;S2.2、根据步骤S2.1得到的Mel频率倒谱系数,对步骤S1得到的体育赛事系统的数字信号数据计算一阶和二阶差分参数,进行特征提取,计算表达式为:其中,d(n)为体育赛事系统的特征提取数据,为语音帧长,为影响语音识别性能系数。3.根据权利要求2所述的一种用于体育赛事系统的语音识别方法,其特征在于,步骤S3的具体实现方法包括如下步骤:S3.1、设置步骤S2得到的体育赛事系统的特征提取数据的长度为μ,将步骤S2得到的体育赛事系统的特征提取数据设置为高斯金字塔底层语音信号,构建高斯金字塔语音信号进行语音信号的分解,计算表达式为:其中,I
D
...
【专利技术属性】
技术研发人员:曲艳,
申请(专利权)人:黑龙江省芯网科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。