【技术实现步骤摘要】
本申请涉及动物物种识别,具体涉及一种视觉与声纹双模态的物种识别方法、装置及存储介质。
技术介绍
1、近年来,随着人工智能技术的飞速发展,多模态识别系统在各种应用场景中得到了广泛的应用,特别是在动物监测和保护领域。传统的动物物种识别主要依赖于视觉信息,如图像和视频,通过计算机视觉技术进行分析和识别。然而,视觉识别技术受到环境因素的限制,这些因素可能导致视觉模型出现误告,影响识别的准确性和可靠性。
技术实现思路
1、本申请的目的在于提供一种视觉与声纹双模态的物种识别方法、装置及存储介质,用以解决现有技术中的视觉识别技术受到环境因素的限制,这些因素可能导致视觉模型出现误告,影响识别的准确性和可靠性的问题。
2、为实现上述目的,本申请实施例提供一种视觉与声纹双模态的物种识别方法,包括:
3、基于yolov5网络构建视觉识别模型,将图像数据输入所述视觉识别模型获取第一识别结果;
4、设置第二阈值,当所述第一识别结果置信度低于所述第二阈值时,通过基于eres2net
...【技术保护点】
1.一种视觉与声纹双模态的物种识别方法,其特征在于,包括:
2.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述基于yolov5网络构建视觉识别模型,具体包括:
3.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述将图像数据输入所述视觉识别模型获取第一识别结果,具体包括:
4.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述通过基于ERes2NetV2网络构建的声纹识别模型获取第二识别结果,具体包括:
5.根据权利要求4所述的视觉与声纹双模态的物种识别方法,其特
...【技术特征摘要】
1.一种视觉与声纹双模态的物种识别方法,其特征在于,包括:
2.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述基于yolov5网络构建视觉识别模型,具体包括:
3.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述将图像数据输入所述视觉识别模型获取第一识别结果,具体包括:
4.根据权利要求1所述的视觉与声纹双模态的物种识别方法,其特征在于,所述通过基于eres2netv2网络构建的声纹识别模型获取第二识别结果,具体包括:
5.根据权利要求4所述的视觉与声纹双模态的物种识别方法,其特征在于,所述采用去噪自动编码器减少声纹样本库...
【专利技术属性】
技术研发人员:姜国智,李瑞,李佳璇,唐瀚,杨柯,潘三明,薛楠,宁业栋,郝雅楠,
申请(专利权)人:中国铁塔股份有限公司云南省分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。