【技术实现步骤摘要】
图像识别方法、装置、计算机设备和存储介质
本申请涉及人工智能
,特别是涉及一种图像识别方法、装置、计算机设备和存储介质。
技术介绍
随着人工智能技术的发展,出现了图像识别技术,基于端到端的图像检测神经网络模型都是采用复杂神经神经网络,模型复杂、参数多、运算耗时长、复杂环境下识别准确度低;这种端到端的神经网络检测方法图像中目标位置检测精度低,造成后续图像内容识别准确度低;同时由于模型输入的限制,输入图像分辨率低,造成本就占有整幅画面极小的待检测图像感兴趣区域细节更加模糊,进一步降低了识别准确率;由于模型复杂,无法实现在终端高效计算,因此增加了后端部署成本以及不能实现实时检测结果输出。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高图像识别准确性和实时性的图像识别方法、装置、计算机设备和存储介质。一种图像识别方法,所述方法包括:获取输入图像,并对所述输入图像进行预处理得到第一图像;获取用于检测待检测目标的位置检测模型;将所述第一图像输入至所述位置检测模型中 ...
【技术保护点】
1.一种图像识别方法,其特征在于,所述方法包括:/n获取输入图像,并对所述输入图像进行预处理得到第一图像;/n获取用于检测待检测目标的位置检测模型;/n将所述第一图像输入至所述位置检测模型中得到所述待检测目标所在的第一区域检测框位置;/n将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中,并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像;/n获取目标识别模型;/n将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理。/n
【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:
获取输入图像,并对所述输入图像进行预处理得到第一图像;
获取用于检测待检测目标的位置检测模型;
将所述第一图像输入至所述位置检测模型中得到所述待检测目标所在的第一区域检测框位置;
将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中,并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像;
获取目标识别模型;
将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理。
2.根据权利要求1所述的方法,其特征在于,在将所述第一图像输入至位置检测模型中之前,还包括:
将所述第一图像进行降低分辨率处理和/或将所述第一图像转化为灰度图。
3.根据权利要求1所述的方法,其特征在于,所述位置检测模型包括第一检测模型,所述第一检测模型为轻量级神经网络模型,所述轻量级神经网络模型被配置为用于获得所述待检测目标所在的第一区域检测框的粗略位置;
所述将包含所述待检测目标的所述第一区域检测框位置映射到所述输入图像中,并在所述输入图像中截取所述第一区域检测框位置对应的区域得到第二图像之前,还包括:
将包含所述待检测目标的所述第一区域检测框的尺寸扩大。
4.根据权利要求3所述的方法,其特征在于,所述将包含所述待检测目标的所述第一区域检测框的尺寸扩大,包括:
将包含所述待检测目标的所述第一区域检测框的尺寸同比例扩大2倍或1倍。
5.根据权利要求3所述的方法,其特征在于,所述位置检测模型还包括第二检测模型;所述将所述第二图像输入至所述目标识别模型中之前,还包括:
获取用于检测待检测目标轮廓的精确外接检测框位置的第二检测模型;
将所述第二图像输入至所述第二检测模型中,获得所述待检测目标的精确区域检测框位置;所述待检测目标的精确区域检测框位置是指所述待检测目标的轮廓外接检测框位置;
将所述精确区域检测框位置对应的图像按照所述目标识别模型的输入要求进行仿射变换,得到第三图像,所述第三图像作为所述目标识别模型输入数据,用于目标内容识别。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述输入图像为车辆监控图像,对所述第二图像进行精确检测得到精确区域检测框位置后,再进行仿射变换得到的第三图像为矩形车牌图像;所述待检测目标为车牌,所述图像内容为车牌信息,所述车牌信息包括车牌字符、车牌颜色、车牌类型中的一种或多种。
7.根据权利要求6所述的方法,其特征在于,所述将所述第二图像输入至所述目标识别模型中以对图像内容进行识别处理,包括:
获取车牌字符识别模型以及对所述第二图像进行精确检测得到精确区域检测框位置后,再进行仿射变换得到的矩形车牌图像;
识别所述矩形车牌图像的背景颜色;
获取与所述背景颜色对应的车牌编码规则;
将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息;
将所述车牌信息送入规则检测器,所述规则检测器用于检测所识别的车牌信息是否符合所述车牌编码规则。
8.根据权利要求7所述的方法,其特征在于,所述车牌字符识别模型包括字符分割模型和字符识别模型;
所述将所述矩形车牌图像输入至车牌识别模型中进行识别得到车牌信息,包括:
获取至少一种尺寸的滑动窗口以及对应的滑动步长参数;
控制所述滑动窗口沿所述矩形车牌图像的长度方向按滑动步长参数对应的滑动步长遍历所述矩形车牌图像;
将各个所述滑动窗口对应的图像块输入至字符分割模型中,获得各个所述滑动窗口对应的图像块内是否是字符的分类概率或置信度;
根据各个所述滑动窗口对应的图像块是否是字符的分类概率或置信度统计分布,按预设条件对所述矩形车牌图像进行字符分割,得到待识别字符块;
将所述字符块输入至字符识别模型获得对应字符信息;
根据所识别得到的字符信息确定车牌信息。
9.根据权利要求7所述的方法,其特征在于,将所述矩形车牌图像输入至车牌字符识别模型中进行识别得到车牌信息,包括:
获取至少一种尺寸的滑动窗口以及对应的滑动步长参数;
控制所述滑动窗口沿所述待矩形车牌图像的长度方向遍历所述矩形车牌图像,获得各个所述滑动窗口对应的区域的字符识别分类概率或置信度,并将当前滑动窗口字符识别分类概率或置信度最大的分类结果作为第一输出结果;
对所述所有滑动窗口的第一输出结果集合进行过滤处理,获得字符识别输出结果;
根据所述字符识别输出结果得到车牌信息。
10.根据权利要求9所述方法,其特征在于,所述对所述第一输出结果进行过滤处理,获得字符识别输出结果,包...
【专利技术属性】
技术研发人员:张官兴,王赟,郭蔚,黄康莹,张铁亮,
申请(专利权)人:绍兴埃瓦科技有限公司,上海埃瓦智能科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。