【技术实现步骤摘要】
多特征融合识别婴儿哭声类别的方法、装置及设备
[0001]本专利技术涉及语音识别
,尤其涉及一种多特征融合识别婴儿哭声类别的方法、装置及设备。
技术介绍
[0002]随着语音识别技术的发展,将语音识别应用到越来越多的领域,比如识别婴儿各种类别的哭声,以确定婴儿对应的各种状况。针对婴儿哭声的识别,一般采用的方法为:采用语音采集技术采集哭声,将采集得到的哭声与已设置的婴儿哭声相匹配,确定是否为婴儿哭声,再将确认的婴儿哭声与已设置的哭声类别相匹配,匹配成功后,就可以确认采集的哭声对应的哭声类别,最终确认婴儿哭声的具体含义。但是,由于婴儿个体之间存在差异,相同哭声表达的不同的需求,特别是在婴儿发声异常时,如声音沙哑、有异物,此时采集的音频信息明显无法判断出婴儿的哭声类别;因此,采用语音识别技术识别婴儿哭声时,准确度和精准度不高,导致用户体验度不高。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供了一种多特征融合识别婴儿哭声类别的方法、装置及设备,用以解决通过语音识别判断婴儿哭声,存在准确性低的技术问题 ...
【技术保护点】
【技术特征摘要】
1.一种多特征融合识别婴儿哭声类别的方法,其特征在于,所述方法包括:S30:获取婴儿啼哭时声音的音频特征、图像中婴儿的姿态动作的动作特征值和声带振动的振动频谱;S31:将所述动作特征值与数据库的标准特征值进行对比,输出与所述动作特征值对应的标准特征值;S32:基于所述标准特征值,对所述音频特征和所述振动频谱进行特征融合,得到与婴儿哭声对应的融合特征;S33:将所述融合特征输入预置的神经网络,输出与婴儿哭声对应的编码特征向量;S34:根据所述编码特征向量,输出婴儿哭泣时的哭声类别;其中,标准特征值为对应的姿态动作所表征的各哭声类别的概率值。2.根据权利要求1所述的多特征融合识别婴儿哭声类别的方法,其特征在于,所述S31包括:S311:获取婴儿啼哭时的视频流;S312:提取所述视频流中各帧图像的运动特征值;S313:将各所述运动特征值与所述数据库的各标准特征值进行对比,将与各帧图像的所述运动特征值相适配的各所述标准特征值输出。3.根据权利要求2所述的多特征融合识别婴儿哭声类别的方法,其特征在于,所述S313包括:S3131:收集婴儿多个姿态动作对应的图像样本集;S3132:提取所述图像样本集中各姿态动作的标准特征值;S3133:建立各所述标准特征值与各哭声类别相对应的所述数据库;S3134:将婴儿哭泣时各帧图像的各所述运动特征值与所述数据库的各所述标准特征值进行对比,输出与各所述运动特征值相适配的各所述标准特征值。4.根据权利要求3所述的多特征融合识别婴儿哭声类别的方法,其特征在于,所述S30包括:S301:获取婴儿啼哭时声带振动产生的电信号;S302:根据各帧图像的时间长度对所述电信号进行分段,得到多个连续的电信号片段;S303:对多个连续的所述电信号片段进行短时傅里叶变换,输出所述振动频谱。5.根据权利要求4所述的多特征融合识别婴儿哭声类别的方法,其特征在于,所述S30包括:S304:获取婴儿哭泣时声音的音频信号;S305:利用梅尔滤波器对所述音频信号进行特征提取,得到所述音频特征;其中,所述音频特征为梅尔频率倒谱系数MFCC特征。6.根据权利要求5所述的多特征融合识别婴儿哭声类别的方法...
【专利技术属性】
技术研发人员:陈辉,张智,谢鹏,雷奇文,艾伟,胡国湖,
申请(专利权)人:武汉星巡智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。