一种机箱前置音频接口检测方法及系统技术方案

技术编号:31825281 阅读:14 留言:0更新日期:2022-01-12 12:51
本发明专利技术涉及一种机箱前置音频接口检测方法及系统,属于音频接口检测技术领域。所述方法包括:S1在机箱内存储语音音频数据;S2建立机箱的前置音频接口与检测设备之间的数据连接;以使语音音频数据通过前置音频接口传输到检测设备;S3检测设备对接收到的语音音频数据进行滤波处理;S4检测设备通过语音识别算法对滤波后的语音音频数据进行语音转换,得到语音音频数据相对应的文字识别结果;S5将转换后的文字识别结果与目标文字进行比对,若比对结果一致,则表示机箱前置音频接口合格;否,则表示机箱前置音频接口不合格。所述系统依托于检测方法,与所述语音音频数据处理相对应。所述方法及系统具有检测准确度较高,适用于音频接口检测。检测。检测。

【技术实现步骤摘要】
一种机箱前置音频接口检测方法及系统


[0001]本专利技术具体涉及一种机箱前置音频接口检测方法及系统,属于音频接口检测


技术介绍

[0002]目前,计算机企业通常采用人工方式检测机箱前置音频接口;检测时,员工使用耳机插入前置音频接口,之后根据听到的声音情况判断机箱前置音频接口是否合格,若是声音清晰、流畅、音量合适,则判断为合格,若是出现有杂音、声音不连续、没有声音、声音过高或过低的情况,则判断为不合格。
[0003]上述人工检测机箱前置音频接口的方法,耗费较多人力资源,成本较高,且耗时较长,若是工作环境嘈杂,就会对工作人员的检测产生阻碍,影响检测效果,故对环境及工作人员状态要求高。
[0004]专利文件《一种针对音频接口的自动化检测方法》提出了运用音频峰值频点或者能量密度来检测音频接口是否合格,若检测频率是音源频率或能量密度达到一定程度就判断为合格,否则判断为不合格;这种方法,存在的问题是:若存在一个与音源信号同频的信号,且能量密度也比较大的一个噪声信号,检测到的不是音源信号也会误判为音源,影响检测结果的准确性,此外,频率测量准确性与检测设备的频率分辨率有很大关系,需要较高精度的检测设备,成本较高。

技术实现思路

[0005]本专利技术的目的在于针对人工检测机箱前置音频接口耗费较多人力资源,成本较高,耗时较长以及现有音频接口自动化检测方法会误判与音源信号同频的信号,且需要较高精度的检测设备、成本高的问题,提出了一种机箱前置音频接口检测方法及系统。
[0006]所述机箱前置音频接口检测系统,包括:待检测设备的机箱,以及与机箱电连接的检测设备;
[0007]其中,所述机箱内存储有语音音频数据;
[0008]所述检测设备包括:滤波模块、识别模块、判断模块;具体如下:
[0009]1)滤波模块,用于对接收到的语音音频数据进行滤波处理;并且滤波模块具体包括量化模块和卷积滤波模块;
[0010]量化模块:用于生成一组滤波系数b
k
,并对滤波系数b
k
进行量化;
[0011]卷积滤波模块:用于利用量化后的滤波系数与语音音频数据进行卷积滤波后,输出滤波后的语音音频数据:
[0012]2)识别模块,用于通过语音识别算法对滤波后的语音音频数据进行语音转换,得到语音音频数据相对应的文字识别结果,具体包括预处理模块、特征提取模块、模型识别模块、文字识别模块、训练模块;
[0013]预处理模块:用于对滤波后的语音音频数据进行预处理,得到多个声音帧,所述的
预处理包括:预加重、分帧和加窗;
[0014]特征提取模块:用于对每个声音帧进行特征数据提取,输出包含有声音信息的多维特征向量;
[0015]模型识别模块:用于通过声学模型、识别字典、以及语言模型对多维特征向量进行识别,输出文字识别序列;
[0016]文字识别模块:用于通过路径搜索算法对文字识别序列进行解码,得到最接近的文字识别结果;
[0017]训练模块,用于通过模型训练工具对声学模型进行训练;
[0018]3)判断模块,将转换后的文字识别结果与目标文字进行比对,若比对结果一致,则表示机箱前置音频接口合格;否则表示机箱前置音频接口不合格。
[0019]为了实现上述目的,本专利技术的技术解决方案包括如下步骤:
[0020]步骤1、在机箱内存储语音音频数据;
[0021]步骤2、建立机箱的前置音频接口与检测设备之间的数据连接;以使语音音频数据通过前置音频接口传输到检测设备;
[0022]步骤3、检测设备对接收到的语音音频数据进行滤波处理;具体包括:
[0023]3.1)生成一组滤波系数b
k
,并对滤波系数b
k
进行量化;
[0024]3.2)利用3.1)量化后的滤波系数与语音音频数据进行卷积滤波后,输出滤波后的语音音频数据;
[0025]步骤4、检测设备通过语音识别算法对滤波后的语音音频数据进行语音转换,得到语音音频数据相对应的文字识别结果;
[0026]其中,语音识别算法具体包括:
[0027]4.1)对滤波后的语音音频数据进行预处理,得到多个声音帧,所述的预处理包括:预加重、分帧和加窗;分帧时帧移和帧长的选取一般根据音频数据总长度进行决定;
[0028]4.2)对每个声音帧进行特征数据提取,输出包含有声音信息的多维特征向量;
[0029]4.3)通过声学模型、识别字典、以及语言模型对多维特征向量进行识别,输出文字识别序列;
[0030]其中,所述的声学模型为隐马尔可夫模型,输入是多维特征向量,输出是音素信息;
[0031]所述的识别字典中,存储有由文字信息对应的文字识别序列;且所述的文字信息与声学模型中的音素信息相对应,即:中文与拼音对应;
[0032]对每个声音帧进行特征数据提取,输出包含有声音信息的多维特征向量中,通过梅尔倒谱系数对每个声音帧进行特征数据提取,具体包括:
[0033]4.3.1)对每一个声音帧,通过FFT得到对应的频谱;
[0034]4.3.2)将得到的频谱通过Mel滤波器组得到Mel频谱;
[0035]4.3.3)在Mel频谱上面进行倒谱分析(取对数、反傅里叶变换(IDFT),获得Mel频率倒谱系数MFCC;
[0036]梅尔倒谱系数(MFCC)的数学表达式如式(1)所示:
[0037]x[k]=IDFT{log|FFT[x(t)]|},k=0,1,2.....
ꢀꢀꢀꢀꢀꢀ
(4.1)
[0038]其中,x(t)是语音数据,x[k]是求出的倒谱系数;
[0039]4.4)通过路径搜索算法对文字识别序列进行解码,得到最接近的文字识别结果;
[0040]其中,路径搜索算法为比特算法;
[0041]维特比算法是一种动态规划算法,用于寻找最有可能产生观测事件序列的

维特比路径

隐含状态序列;本方法中将声音信号作为观察到的事件序列,而文本字符串,被看作是隐含的产生声音信号的原因,对声音信号应用维特比算法寻找最有可能的文本字符串;所述维特比算法的表达式为:
[0042]V
1,k
=P(y1|k)
·
π
k
[0043]...
[0044]V
t,k
=max{P(y
t
|k)
·
a
x,k
·
V
t

1,k
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4.2)
[0045]式(4.2)中,V
t,k
是前t个最终状态为k的观测结果、最有可能对应的状态序列的概率;π
k
为状态为k的概率;a
x,k
为从状态x到状态k的转移概率;y1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机箱机箱前置音频接口检测系统,包括:待检测设备的机箱以及与机箱电连接的检测设备,所述机箱内存储有语音音频数据,其特征在于:所述检测设备包括:滤波模块、识别模块及判断模块;所述滤波模块,用于对接收到的语音音频数据进行滤波处理;并且滤波模块具体包括量化模块和卷积滤波模块;量化模块:用于生成一组滤波系数b
k
,并对滤波系数b
k
进行量化;卷积滤波模块:用于利用量化后的滤波系数与语音音频数据进行卷积滤波后,输出滤波后的语音音频数据:识别模块,用于通过语音识别算法对滤波后的语音音频数据进行语音转换,得到语音音频数据相对应的文字识别结果,具体包括预处理模块、特征提取模块、模型识别模块、文字识别模块、训练模块;预处理模块:用于对滤波后的语音音频数据进行预处理,得到多个声音帧,所述的预处理包括:预加重、分帧和加窗;特征提取模块:用于对每个声音帧进行特征数据提取,输出包含有声音信息的多维特征向量;模型识别模块:用于通过声学模型、识别字典、以及语言模型对多维特征向量进行识别,输出文字识别序列;文字识别模块:用于通过路径搜索算法对文字识别序列进行解码,得到最接近的文字识别结果;训练模块,用于通过模型训练工具对声学模型进行训练;所述判断模块,将转换后的文字识别结果与目标文字进行比对,若比对结果一致,则表示机箱前置音频接口合格;否则表示机箱前置音频接口不合格。2.一种机箱前置音频接口检测方法,其特征在于:包括:步骤1、在机箱内存储语音音频数据;步骤2、建立机箱的前置音频接口与检测设备之间的数据连接;以使语音音频数据通过前置音频接口传输到检测设备;步骤3、检测设备对接收到的语音音频数据进行滤波处理,输出滤波后的语音音频数据;步骤4、检测设备通过语音识别算法对滤波后的语音音频数据进行语音转换,得到语音音频数据相对应的文字识别结果,具体包括如下子步骤:步骤4.1)预处理模块对滤波后的语音音频数据进行预处理,得到多个声音帧;步骤4.2)训练模块通过模型训练工具对声学模型进行训练;步骤4.3)特征提取模块对每个声音帧进行特征数据提取,输出包含有声音信息的多维特征向量,具体通过梅尔倒谱系数对每个声音帧进行特征数据提取;步骤4.4)模型识别模块通过声学模型、识别字典以及语言模型对多维特征向量进行识别,输出文字识别序列;其中,所述的声学模型为隐马尔可夫模型,输入是多维特征向量,输出是音素信息;所述的识别字典中存储有由文字信息对应的文字识别序列;且所述的文字信息与声学模型中的音素信息相对应,即:中文与拼音对应;
因此,经过识别字典及语言模型后,输出文字识别序列;步骤4.5)文字识别模块通过路径搜索算法对文字识别序列进行解码,得到转换后的文字识别结果;步骤5、判断模块将转换后的文字识别结果与目标文字进行比对,若比对结果一致,则表示机箱前置音频接口合格;否则表示机箱前置音频接口不合格。3.根据权利要求2所述的一种机箱前...

【专利技术属性】
技术研发人员:张川川王宪朝范丽华张佳慧籍勇杰范广明赵鹏伟明星
申请(专利权)人:百信信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1