一种咳嗽及喷嚏监测识别方法技术

技术编号:27108184 阅读:62 留言:0更新日期:2021-01-25 19:00
本发明专利技术公开了一种咳嗽及喷嚏监测识别方法,属于语音识别技术领域。其包括以下步骤:咳嗽信号预处理、咳嗽信号特征提取、算法识别、采用单片机及WiFi模块传输、服务器及后端接收并前端显示。本发明专利技术的有益效果是:采用非特定人语音识别和连续语音识别技术,进而开发咳嗽识别,显著提高目前市场上的咳嗽识别系统的准确度和应用性,本发明专利技术能够不需要提前录入咳嗽声音进行训练则能够准确的在大范围的生活场景中识别咳嗽的人并显示和报警,此外,本发明专利技术基于连续语音识别技术,则对于连续咳嗽的高风险人群识别提高了准确性。人群识别提高了准确性。人群识别提高了准确性。

【技术实现步骤摘要】
一种咳嗽及喷嚏监测识别方法


[0001]本专利技术涉及一种咳嗽及喷嚏监测识别方法,属于语音识别


技术介绍

[0002]目前国内外采取咳嗽识别的本地离线语音识别芯片所涉及的技术包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术作为人工智能的支撑,语音识别,语音控制以及和WiFi/蓝牙组合是应用的主要表现形式。
[0003]市场现有咳嗽识别的离线语音识别芯片的内部单片机主要为24MHZ、48MHZ、240MHZ、600MHZ主频,采用8K算法小模型、16K算法大模型。主要基于特定人语音识别,即针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练两遍语音词条即可使用。并基于非连续语音识别,对于非连续语音来说,识别所说的每一个字必须分开辨认,要求说完每个字后都要停顿。
[0004]目前市场上的咳嗽识别的语音芯片是基于特定人的语音识别和非连续语音识别,实际在日常场景的使用中有很大的局限性。基于特定人的语音识别需要特定人提前录入声音,对于其他人的语音不进行识别,采用这种方法的咳嗽识别只能针对特定人的咳嗽识别,在正常使用中不可能提前让所有人的咳嗽声音先录入然后在进行比对,更别提在流动人口大的公共区域进行咳嗽识别。对于在大面积多人口流动性强的地方进行咳嗽识别应用目前市场上的方法显然不行。
[0005]此外,基于非连续语音识别的语音识别芯片而开发的咳嗽识别系统,需要单个字单个字的停顿从而才能识别,如果是连续的一句话则识别率大大下降、错误率明显提高。但是非连续语音识别来开发咳嗽识别受到很大的掣肘。虽然看似咳嗽声是单独的,但是不能排除连续咳嗽声的场景,尤其是人流量大的公共区域。而且,连续咳嗽的人患病的风险会随之变高,如果基于非连续语音识别,此类高危险人群的识别则会受到很大的影响,从而会提高其他健康人群被危险人群传染的风险。

技术实现思路

[0006]本专利技术所要解决的技术问题在于:提供一种咳嗽及喷嚏监测识别方法,它解决了现有技术中对于咳嗽声的识别时,特定人的语音识别需要特定人提前录入声音,对于其他人的语音不进行识别的问题。
[0007]本专利技术所要解决的技术问题采取以下技术方案来实现:
[0008]一种咳嗽及喷嚏监测识别方法,包括以下步骤:
[0009]S1.咳嗽信号预处理,具体包括以下步骤:
[0010]S11.采样与量化,对声音信号进行采样与量化,获取到的初始声音样本信号用连续的信号,以等时间间隔对其进行采样,得到离散的信号;
[0011]S12.滤波,对采样与量化后的声音信号进行滤波处理;
[0012]S13.加窗分帧,将声音信号划分为许多个时间相等的声音段;
[0013]S14.端点检测,对声音信号进行端点检测,确定获取的每一个声音样本是否是有效的发声,并且在有效的声音样本中确定出有用信号的起始点和终止点,为后期提取特征参数做准备;
[0014]S2.咳嗽信号特征提取,对预处理后的声音信号进行功率谱密度分析,在分析结果的基础上设计有效的信号特征提取算法,获取识别咳嗽声信号的参考特征,在获得声音信号功率谱密度的基础上,对一定量的声音样本信号进行训练,得到平均功率谱密度来作为声音信号的分类特征;
[0015]S3.算法识别,训练得到咳嗽声的功率谱密度特征后,以此特征曲线作为聚类中心,在模糊C均值聚类算法的基础上设计出识别算法,对咳嗽声进行识别,具体包括以下步骤:
[0016]S31.以获得的咳嗽声功率谱密度特征和尖叫声功率谱密度特征作为两个聚类中心v1(n)和v2(n)聚合的两个类分别用w1和w2表示;
[0017]S32.将每一个要分类的声音样本的功率谱密度用P
N
表示,按点N分别来计算到各聚类中心的距离,计算公式如下:
[0018]d(P
n
,v1(n))=||P
n-v1(n)||,i=1,2,n=1,2,...,N
[0019]S33.按最小距离原则,对声音样本的功率谱密度P
N
的N个点进行聚类,并在程序中分别以j和k计数来记录类属情况,表示如下:
[0020]若d(P
n
,v1(n))=d(P
n
,v2(n)),则j,k不变
[0021]若d(P
n
,v1(n))>d(P
n
,v2(n)),则k=k+1,n=1,2,...N,j+k≤N
[0022]若d(P
n
,v1(n))=d(P
n
,v2(n)),则j、k不变
[0023]S34.计数值j和k反映了声音样本的功率谱密度P
N
的N个点的聚类情况,根据它们值的大小,定义如下的识别方法:
[0024]若j>k,则P
N
∈w1[0025]若j<k,则P
N
∈w2[0026]S4.采用单片机及WiFi模块传输;
[0027]S5.服务器及后端接收并前端显示。
[0028]作为优选实例,所述步骤S21中,采用巴特沃斯低通滤波器对采样与量化后的声音信号进行滤波处理。
[0029]作为优选实例,所述步骤S4中,采用单片机及WiFi模块传输,设置语音识别模块的串口发送指令发送串口数据0x55,设置完成后每次语音识别模块识别到咳嗽声音,则向单片机发送0x55数据将语音识别模块通过D型数据接口连接器接口将语音模块的输出与单片机的串口USART1进行连接,单片机通过串口USART2与WiFi模块进行连接。
[0030]作为优选实例,所述步骤S5中,服务器及后端接收并前端显示,边缘算法服务器使用Java语言,Springboot框架暴露咳嗽异常检测接口,在进程启动时,使用JavaCV拉取摄像头视频流但不做任何操作,当硬件检测到咳嗽时,请求边缘算法服务器java后端,后端截取摄像头当前帧的图片并转发报告给超算中心服务器,由超算中心服务器进行数据存储并通过Websocket长连接形式与前端展示页面实现数据的实时交互展示;后端收到请求之后会将请求的响应结果发送给浏览器端,前端通过处理结果将咳嗽等数据动态的渲染在前端页
面上。
[0031]本专利技术的有益效果是:
[0032](1)采用非特定人语音识别和连续语音识别技术,进而开发咳嗽识别,显著提高目前市场上的咳嗽识别系统的准确度和应用性,本专利技术能够不需要提前录入咳嗽声音进行训练则能够准确的在大范围的生活场景中识别咳嗽的人并显示和报警,此外,本专利技术基于连续语音识别技术,则对于连续咳嗽的高风险人群识别提高了准确性;
[0033](2)基于目标优化思想训练声音信号功率谱密度特征,获得了有效的咳嗽声和尖叫声识别分类特征,且方法简单、高效;
[0034](3)在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种咳嗽及喷嚏监测识别方法,其特征在于,包括以下步骤:S1:咳嗽信号预处理;具体包括以下步骤:S1.1:采样与量化;对声音信号进行采样与量化,获取到的初始声音样本信号用连续的信号,以等时间间隔对其进行采样,得到离散的信号;S1.2:滤波;对采样与量化后的声音信号进行滤波处理;S1.3:加窗分帧;将声音信号划分为许多个时间相等的声音段;S1.4:端点检测;对声音信号进行端点检测,确定获取的每一个声音样本是否是有效的声音样本,并且在有效的声音样本中确定出有用信号的起始点和终止点,为后期提取特征参数做准备;S2:咳嗽信号特征提取;对S1预处理确定出的有用信号进行功率谱密度分析,在分析结果的基础上设计有效的信号特征提取算法,获取识别咳嗽声信号的参考特征,在获得声音信号功率谱密度的基础上,对一定量的声音样本信号进行训练,得到平均功率谱密度来作为声音信号的分类特征;S3:算法识别;训练得到咳嗽声的功率谱密度特征后,以此特征曲线作为聚类中心,在模糊C均值聚类算法的基础上设计出识别算法,对咳嗽声进行识别,具体包括以下步骤:S3.1:以获得的咳嗽声功率谱密度特征和尖叫声功率谱密度特征作为两个聚类中心v1(n)和v2(n)聚合的两个类分别用w1和w2表示;S3.2:将每一个要分类的声音样本的功率谱密度用P
N
表示,按点N分别来计算到各聚类中心的距离,计算公式如下:d(P
n
,v1(n))=||P
n-v1(n)||,i=1,2,n=1,2,...,NS3.3:按最小距离原则,对声音样本的功率谱密度P
N
的N个点进行聚类,并在程序中分别以j和k计数来记录类属情况,表示如下:若d(P
n
,v1(n))=d(P
n
,v2(n)),则j,k不变若d(P
n
,v1(n)...

【专利技术属性】
技术研发人员:邵宇丰周锦霆
申请(专利权)人:上海荷福人工智能科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1