一种复杂环境下生猪连续咳嗽声音识别方法技术

技术编号:39739463 阅读:6 留言:0更新日期:2023-12-17 23:40
本发明专利技术涉及语音信号处理技术领域,特别是涉及一种复杂环境下生猪连续咳嗽声音识别方法,包括:采集猪舍内的连续声音,基于所述连续声音构建语料库;对所述语料库进行多重端点检测,获取单个声音段以及所述单个声音段的开始时间和结束时间;对所述单个声音段进行分类识别,判断所述单个声音段是否为咳嗽,若为咳嗽,则基于所述单个声音段的开始时间和结束时间计算相邻咳嗽之间的时间间隔,根据所述时间间隔判断是否为连续咳嗽

【技术实现步骤摘要】
一种复杂环境下生猪连续咳嗽声音识别方法


[0001]本专利技术涉及语音信号处理
,特别是涉及一种复杂环境下生猪连续咳嗽声音识别方法


技术介绍

[0002]生猪呼吸道疾病是制约生猪养殖行业发展的主要原因之一

近年来研究表明,生猪咳嗽声音监测是实现呼吸道疾病预警的一种有效手段,且对于单咳和连咳的监测对生猪疾病预警与诊断具有重要的意义

已有研究主要集中在孤立词识别方法上,主要方法包括特征选择

特征融合

分类器优化和分类器融合等,以此来提升分类性能

但这些方法无法实现连续声音中咳嗽的检测,且已有研究缺乏对连咳的识别

同时,已有研究对实际猪舍环境的复杂性考虑较少

[0003]专利
ZL202211128776.2
公开了一种基于改进
DS
证据理论多分类器融合的猪咳嗽声识别方法,包括:收集猪舍内生猪的声音片段,获得语料库;基于语料库,得到训练集和测试集,提取训练集和测试集中的多个声学特征;将训练集中的多个声学特征输入至若干基分类器中,输出得到若干基分类器性能评价指标;根据基分类器性能评价指标,筛选基分类器,得到优选基分类器;利用训练集训练优选基分类器,完成目标训练模型;将测试集输入目标训练模型,并采用改进的
DS
证据理论对优选基分类器的输出结果进行融合,完成猪咳嗽声音识别

该专利技术只是对单个咳嗽声进行识别,缺少对连咳的识别

[0004]专利
ZL202210938605.X
公开了一种基于分类器融合的生猪咳嗽声音识别方法,包括:收集猪舍内生猪的声音片段,获得语料库;对语料库进行标注,获得咳嗽声音片段与非咳嗽声音片段;基于咳嗽声音片段与非咳嗽声音片段按照一定比例划分为训练集和测试集,提取训练集中声音信号的声学特征和图像特征;构建支持向量机训练模型,将声学特征和图像特征输入支持向量机训练模型进行模型训练,获得目标训练模型;将测试集的数据输入目标训练模型进行分类,获得分类结果,完成猪咳嗽声音的识别

该专利技术对单个咳嗽声进行识别,缺少对连咳的识别,同时缺少对基分类器的优化筛选

[0005]此外,现有的猪咳嗽声识别方法例如专利
CN202210004800.5

CN202210004775.0

CN201811402994.4
,均对单个咳嗽声进行识别,缺少对连咳的识别,同时未充分考虑猪舍的复杂情况,导致在复杂环境下识别精度下降

因此,亟需一种复杂环境下生猪连续咳嗽声音识别方法


技术实现思路

[0006]本专利技术的目的是针对上述技术问题,提供一种复杂环境下生猪连续咳嗽声音识别方法,实现连咳的识别,并提高复杂环境下生猪咳嗽声的识别精度

[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种复杂环境下生猪连续咳嗽声音识别方法,包括:
[0009]采集猪舍内的连续声音,基于所述连续声音构建语料库;
[0010]对所述语料库进行多重端点检测,获取单个声音段以及所述单个声音段的开始时间和结束时间;
[0011]对所述单个声音段进行分类识别,判断所述单个声音段是否为咳嗽,若为咳嗽,则基于所述单个声音段的开始时间和结束时间计算相邻咳嗽之间的时间间隔,根据所述时间间隔判断是否为连续咳嗽

[0012]进一步地,对所述语料库进行多重端点检测之前,还包括对所述语料库进行处理的步骤,所述对所述语料库进行处理包括:
[0013]对所述语料库进行标记,然后将所述语料库划分为训练集和测试集,并对所述训练集和测试集中的连续声音进行预加重

滤波

分帧和加窗处理,以及计算所述连续声音每一帧的短时能量

[0014]进一步地,对所述语料库进行多重端点检测,获取单个声音段以及所述单个声音段的开始时间和结束时间包括:
[0015]将所述训练集和测试集输入预设的多重端点检测模型,获取所述训练集和测试集中单个声音段以及所述单个声音段的开始时间和结束时间,其中,所述多重端点检测模型基于能量的双门限端点检测法设置动态门限构建,所述动态门限分别为:
[0016]T
high

b
×
E
noise
[0017]T
low

a
×
E
noise
[0018]式中,
T
high
为较大的门限,
T
low
为较小的门限,
E
noise
为连续声音的前
N
帧噪声段的能量,
a

b
为门限参数,所述门限参数通过将所述训练集输入所述多重端点检测模型进行线性搜索,获取目标函数的最小值即为所述门限参数,所述目标函数为:
[0019]P0=
P
miss
+0.2*P
false
[0020]式中,
P
miss

P
false
分别表示咳嗽帧漏检率和咳嗽帧误检率,定义为:
[0021]P
miss

N
miss
/N
f
[0022]P
false

N
false
/N
f
[0023]式中,
N
f
表示有声段总帧数,
N
miss
表示漏帧数,
N
false
表示错帧数;
[0024]所述多重端点检测模型的工作过程包括:
[0025]预设所述单个声音段的最大持续时间
T


最大检测次数
M

[0026]设置第一门限参数
a1和
b1,进行第一次端点检测,获取第一次端点检测结果;
[0027]判断所述第一次端点检测结果中是否存在持续时间大于
T
秒的单个声音段,若不存在,则结束检测,若存在,则计算所述第一次端点检测的目标函数,并设置第二门限参数
a2和
b2,
对所述持续时间大于
T
秒的单个声音段进行第二次端点检测,获取第二次端点检测结果,判断所述第二次端点检测结果中是否存在持续时间大于
T
秒的单个声音段,若不存在,则结束检测,若存在,则计算所述第二次端点检测的目标函数,并判断所述第二次端点检测的目标函数是否不低于所述第一次端点检测的目标函数,若不低于,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种复杂环境下生猪连续咳嗽声音识别方法,其特征在于,包括:采集猪舍内的连续声音,基于所述连续声音构建语料库;对所述语料库进行多重端点检测,获取单个声音段以及所述单个声音段的开始时间和结束时间;对所述单个声音段进行分类识别,判断所述单个声音段是否为咳嗽,若为咳嗽,则基于所述单个声音段的开始时间和结束时间计算相邻咳嗽之间的时间间隔,根据所述时间间隔判断是否为连续咳嗽
。2.
根据权利要求1所述的复杂环境下生猪连续咳嗽声音识别方法,其特征在于,对所述语料库进行多重端点检测之前,还包括对所述语料库进行处理的步骤,所述对所述语料库进行处理包括:对所述语料库进行标记,然后将所述语料库划分为训练集和测试集,并对所述训练集和测试集中的连续声音进行预加重

滤波

分帧和加窗处理,以及计算所述连续声音每一帧的短时能量
。3.
根据权利要求2所述的复杂环境下生猪连续咳嗽声音识别方法,其特征在于,对所述语料库进行多重端点检测,获取单个声音段以及所述单个声音段的开始时间和结束时间包括:将所述训练集和测试集输入预设的多重端点检测模型,获取所述训练集和测试集中单个声音段以及所述单个声音段的开始时间和结束时间,其中,所述多重端点检测模型基于能量的双门限端点检测法设置动态门限构建,所述动态门限分别为:
T
high

b
×
E
noise
T
low

a
×
E
noise
式中,
T
high
为较大的门限,
T
low
为较小的门限,
E
noise
为连续声音的前
N
帧噪声段的能量,
a

b
为门限参数,所述门限参数通过将所述训练集输入所述多重端点检测模型进行线性搜索,获取目标函数的最小值即为所述门限参数,所述目标函数为:
P0=
P
miss
+0.2*P
false
式中,
P
miss

P
false
分别表示咳嗽帧漏检率和咳嗽帧误检率,定义为:
P
miss

N
miss
/N
f
P
fals

N
false
/N
f
式中,
N
f
表示有声段总帧数,
N
miss
表示漏帧数,
N
false
表示错帧数;所述多重端点检测模型的工作过程包括:预设所述单个声音段的最大持续时间
T


最大检测次数
M
;设置第一门限参数
a1和
b1,
进行第一次端点检测,获取第一次端点检测结果;判断所述第一次端点检测结果中是否存在持续时间大于
T
秒的单个声音段,若不存在,则结束检测,若存在,则计算所述第一次端点检测的目标函数,并设置第二门限参数
a2和
b2,
对所述持续时间大于
T
秒的单个声音段进行第二次端点检测,获取第二次端点检测结果,判断所述第二次端点检测结果中是否存在持续时间大于
T
秒的单个声音段,若不存在,则结束检测,若存在,则计算所述第二次端点检测的目标函数,并判断所述第二次端点检测的目标函数是否不低于所述第一次端点检测的目标函数,若不低于,则结束检测,若低于,则再次进行下一次端点检测,以此迭代,直至端点检测结果中不存在持续时间大于
T
秒的单个声音
段,或端点检测的目标函数不低于前一次端点检测的目标函数,或达到所述最大检测次数
M
,检测结束
。4.
根据权利要求3所述的复杂环境下生猪连续咳嗽声音识别方法,其特征在于,对所述单个声音段进行分类识别包括:提取所述训练集和测试集中单个声音段的声学特征和深度特征,将所述测试集中单个声音段的声学特征和深度特征输入预设的分类模型中,获取所述测试集中单个声音段的咳嗽识别结果,其中,所述分类模型通过将所述训练集中单个声音段的声学特征和深度特征输入分类器进行训练得到
。5.
根据权利要求4所述的复杂环境下生猪连续咳嗽声音识别方法,其特征在于,所述声学特征包括梅尔频率倒谱系数和功率谱密度,所述深度特征为通过卷积神经网络从图像特征中提取的特征,所述图像特征包括语谱图

【专利技术属性】
技术研发人员:尹艳玲沈维政王锡鹏寇胜利戴鑫鹏张宇
申请(专利权)人:东北农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1