哭声识别方法、装置、设备及存储介质制造方法及图纸

技术编号：33360082 阅读：30 留言：0更新日期：2022-05-11 22:14

本发明专利技术涉及人工智能技术领域，公开了一种哭声识别方法、装置、设备及存储介质，所述方法包括：从待识别多媒体文件中提取待识别声音数据；根据待识别声音数据生成待识别声谱；根据预设哭声识别模型对待识别声谱进行识别，以获得哭声识别结果。由于现有技术中，需要通过人为主动观察监控录像，进而判定是否存在哭声情况，但这样不仅会导致哭声识别效率低下，还会导致哭声检测结果不精准，而本发明专利技术中将待识别声谱输入至预设哭声识别模型中，以获得哭声识别结果，实现了精准获取哭声识别结果，提高了哭声识别效率。哭声识别效率。哭声识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
哭声识别方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种哭声识别方法、装置、设备及存储介质。

技术介绍

[0002]现今婴儿看护方面的消费仅仅停留在雇佣保姆和医院育婴。随着社会的发展，人力成本昂贵等问题逐渐涌现，无疑增加了那些需要聘请保姆护理家庭的年轻父母的负担。加之现在的年轻父母在外忙碌时间越来越多，故对自己婴儿缺乏照顾。如果交给老人照看婴儿，老人上了年纪，照顾婴儿可能会有所疏忽，会出现婴儿哭闹没被及时护理，现有技术中，仅能通过观察监控人为识别婴儿哭闹，但这样不仅会导致哭声识别效率低下，还会导致哭声检测结果不精准。
[0003]上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供了一种哭声识别方法、装置、设备及存储介质，旨在解决如何实现精准获取哭声识别结果，进而提高哭声识别效率的技术问题。
[0005]为实现上述目的，本专利技术提供了一种哭声识别方法，所述哭声识别方法包括：r/>[0006]从本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种哭声识别方法，其特征在于，所述哭声识别方法包括以下步骤：从待识别多媒体文件中提取待识别声音数据；根据所述待识别声音数据生成待识别声谱；根据预设哭声识别模型对所述待识别声谱进行识别，以获得哭声识别结果。2.如权利要求1所述的方法，其特征在于，所述从待识别多媒体文件中提取待识别声音数据的步骤之前，还包括：获取多个样本哭声数据和多个样本非哭声数据；根据各样本哭声数据生成对应的样本哭声频谱，以及根据各样本非哭声数据生成对应的样本非哭声频谱；分别对所述样本哭声频谱和所述样本非哭声频谱进行预处理，获得样本哭声梅尔频谱和样本非哭声梅尔频谱；根据获得的样本哭声梅尔频谱构建样本哭声频谱集；根据获得的样本非哭声梅尔频谱构建样本非哭声频谱集；根据所述样本哭声频谱集和所述样本非哭声频谱集对初始网络模型进行训练，以获得预设哭声识别模型。3.如权利要求2所述的方法，其特征在于，所述对所述样本哭声频谱进行预处理，获得样本哭声梅尔频谱的步骤，包括：对所述样本哭声频谱进行分割处理，获得样本哭声低频谱和样本哭声高频谱；对所述样本哭声高频谱中的语音信号进行处理，获得样本哭声幅度特性频谱；将所述样本哭声低频谱和所述样本哭声幅度特性频谱进行拟合，获得待处理样本哭声频谱；根据所述待处理样本哭声频谱确定样本哭声梅尔频谱。4.如权利要求3所述的方法，其特征在于，所述对所述样本哭声高频谱中的语音信号进行处理，获得样本哭声幅度特性频谱的步骤，包括：对所述样本哭声高频谱中的语音信号进行预加重处理，获得样本哭声高滤频谱；对所述样本哭声高滤频谱中的语音信号进行加窗处理，获得样本哭声幅度特性频谱。5.如权利要求3所述的方法...

【专利技术属性】
技术研发人员：眭一帆，
申请(专利权)人：北京鸿享技术服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人