【技术实现步骤摘要】
基于多通道融合的图像识别方法、装置和存储介质
[0001]本专利技术涉及计算机视觉相关
,更具体地,涉及一种基于多通道融合的图像识别方法、装置和存储介质。
技术介绍
[0002]随着机器视觉与人工智能技术的发展,基于机器视觉的人工智能应用已广泛应用于各行各业,如人脸检测、行人追踪、目标检测等。然而定制化的人工智能在智慧工地应用中仍然存在一定困难:一方面,视觉应用相关的人工智能场景往往需要GPU服务器计算资源予以算力支撑,在部署端实施需要现场机房提供部署条件;另一方面,不同应用场景的定制化需求(如保安识别、着装识别)需要对算法模型进行定制化的开发。
[0003]目前,边缘端的机器视觉人工智能应用如图像分类、目标定位、目标识别等,为了达到较高的可应用性,需要在应用边缘端部署服务器+GPU显卡进行业务处理及模型应用。其缺点是:1、成本高,一台服务器加显卡价格往往达到几万元;2、部署要求高,需要将服务器部署于机房机柜并保证散热条件。经过检索,中国专利公开号CN214846751U公开了一种基于边缘计算的移动人脸布控装置 ...
【技术保护点】
【技术特征摘要】
1.一种基于多通道融合的图像识别方法,所述图像识别方法包括:获取步骤,获取历史样本的包含人体口腔区域的多张图像;筛选步骤,从所述获取步骤中获取的多张图像中,筛选出每个历史样本的特定数量的历史图像;融合步骤,将所述每个历史样本的筛选出的特定数量的历史图像进行多通道融合处理,得到融合后的图像作为各历史样本的输入图像,以建立训练数据集;构建步骤,基于深度网络算法,构建图像识别模型,并使用所述训练数据集训练所述图像识别模型;识别步骤,通过将待识别图像输入训练后的图像识别模型,进行图像识别,以得到图像识别结果。2.根据权利要求1所述的图像识别方法,其中,在所述筛选步骤中根据预设筛选参数和筛选规则,从所述获取步骤中获取的多张图像中,筛选出每个历史样本的特定数量的图像;所述预设筛选参数包括张口度、气道分级、颈长、颈围、头颈活动度和甲颏间距,所述筛选规则包括张口度是否小于指定值,气道分级是否大于指定级别,颈长是否小于设定值或者颈围是否小于设定值,头颈活动度是否小于特定角度,甲颏间距是否小于指定距离。3.根据权利要求1或2所述的图像识别方法,其中,在所述融合步骤中,按照红绿蓝三通道,将所述每个历史样本的筛选出的特定数量的历史图像中各图像拆分成三个通道,并将拆分后的各图像按通道进行图像拼接,以得到融合后的图像。4.根据权利要求1所述的图像识别方法,其中,在所述融合步骤中,所述建立训练数据集包括:通过使用气道分级大于等于指定级别、张口度是否小于预定值、颈长是否小于设定值或者颈围是否小于设定值、头颈活动度是否小于特定角度以及甲颏间距是否小于指定距离,定义目标气道的类别标签,来定义正样本和负样本,以确定目标气道和非目标气道,并使用标注有气道类别的通道融合后的图像,建立训练数据集。5.根据权利要求1所述的图像识别方法,其中,在所述构建步骤中,包括:通过利用设定的卷积核对特定数量的历史图像进行卷积计算,来完成一次特征提取,得到底层特征信息,并得到第一特征图、第二特征图、第三特征图、第四特征图和第五特征图,第一特征图为包含张口度信息的特征图,第二特征图为包含气道分级信息的特征图...
【专利技术属性】
技术研发人员:张加强,王广治,吴苏,王梅云,
申请(专利权)人:河南省人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。