图像识别方法、装置及电子设备制造方法及图纸

技术编号:9907060 阅读:78 留言:0更新日期:2014-04-11 06:14
本申请实施例公开了一种图像识别方法、装置及电子设备,其中,该方法包括:获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象;获取每个所述识别结果中所述对象的置信度信息;根据所述置信度信息,获取目标识别结果。该方法可以对扫描设备在多种拍摄条件下获取到图像的识别结果集中进行分析,与基于单帧图像进行识别的方法相比,不仅减少获取单帧图像之间调整扫描设备占用的时间,而且可以避免单帧图像的识别结果的偶然性,降低识别错误出现的几率,提高识别效率及准确率。

【技术实现步骤摘要】
图像识别方法、装置及电子设备
本申请涉及图像识别
,特别是涉及一种图像识别方法、装置及电子设备。
技术介绍
目前,OCR(OpticalCharacterRecognition,光学字符识别)技术越来越多地应用到带有图像扫描(拍照或摄像)功能的移动智能终端设备上,例如手机、相机、平板电脑、PDA、扫描仪和POS机等。现有的OCR识别方法,通常是扫描得到单帧图像,然后基于扫描到的单帧图像,对图像中的内容进行识别,提取图像中的内容,得到识别结果,当识别结果满足要求时,显示识别结果,当识别结果不满足要求时,则需要继续进行扫描,并对再次扫描到的单帧图像进行识别。在完成一次识别过程中,用户为了得到正确的识别结果,需要不断调整扫描设备的拍摄角度、位置以及光照,对同一目标区域进行扫描,通常三者一起调整,以获取有利于识别的单帧图像。在现实操作中,由于上述三种条件难以同时都满足,甚至只有在特定拍照角度、特定的位置以及特定光照的情况下,才能扫描得到高质量的图像,所以通常扫描得到的图像质量比较差。利用这些质量比较差的图像进行识别,导致无法快速得到识别结果,识别的效率低,并且识别准确率也低。
技术实现思路
本申请中提供了一种图像识别方法、装置及电子设备,以解决相关技术中的识别效率低、准确率低的问题。为了解决上述技术问题,本申请公开了如下技术方案:第一方面,本申请提供了一种图像识别方法,包括:获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象;获取每个所述识别结果中所述对象的置信度信息;根据所述置信度信息,获取目标识别结果。结合第一方面,在第一方面第一种可能的实现方式中,所述对象包括:数字、字母、汉字和符号中的一种或多种组合。结合第一方面或第一方面第一种可能的实现方式,在第一方面第二种可能的实现方式中,所述对象的置信度信息包括:对象的最小置信度、平均置信度和/或数量置信度。结合第一方面第二种可能的实现方式,在第一方面第三种可能的实现方式中,所述根据所述置信度信息,获取目标识别结果,包括:获取与所述置信度信息对应的预设权值;根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;将加权值最大的所述识别结果确定为目标识别结果。结合第一方面第三种可能的实现方式,在第一方面第四种可能的实现方式中,所述将加权值最大的所述识别结果确定为目标识别结果,包括:获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个位于所述识别结果对应图像中的位置,第一区域内相同位置上所有参考识别结果中对象都相同,第二区域内相同位置上所有参考识别结果中的对象全部不相同或部分不相同;将加权值最大且标示出所述第一区域和第二区域的所述识别结果确定为目标识别结果。结合第一方面第三种可能的实现方式或第四种可能的实现方式,在第一方面第五种可能的实现方式中,所述方法还包括:判断所述目标识别结果的加权值是否小于预设加权阈值;当所述目标识别结果的加权值小于预设加权阈值时,获取所述目标区域的新增帧图像的识别结果,并返回执行获取每个所述识别结果中所述对象的置信度信息,所述新增帧图像与至少两帧所述图像中任意一个都不同;当所述目标识别结果的加权值不小于预设加权阈值时,输出所述目标识别结果。结合第一方面第二种可能的实现方式,在第一方面第六种可能的实现方式中,所述根据所述置信度信息,获取目标识别结果,包括:获取与所述置信度信息对应的预设权值;根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个位于所述识别结果对应图像中的位置,第一区域内相同位置上所有参考识别结果中的对象都相同,第二区域内相同位置上所有参考识别结果中的对象全部不相同或部分不相同;融合所述第二区域内相同位置上所有参考识别结果中的对象得到目标对象,所述目标对象为所有参考结果中相同位置上包含的所有对象中的一个;将包含所述第一区域内的对象和所述第二区域内融合后得到的目标对象的识别结果确定为目标识别结果。结合第一方面第六种可能的实现方式,在第一方面第七种可能的实现方式中,所述融合所述第二区域内相同位置上所有参考识别结果中的对象得到目标对象,包括:在所述第二区域内选择一个位置作为目标位置;获取所述目标位置上的所有参考识别结果中的对象,所述目标位置上包括至少两类对象,同类的对象相同,不同类的对象不相同;根据X=L+M*k+N,获取与加权值最大的参考识别结果中所述目标位置上对象同类的对象的准确率;根据X=L+M*k,获取与除加权值最大的参考识别结果外的参考识别结果中所述目标位置上对象同类的对象的准确率;将准确率最大的一类对象确定为所述目标位置上的目标对象;在所述第二区域内选择未被选择为目标位置的位置作为下一个目标位置,直至所述第二区域内不存在未被选择为目标位置的位置,其中,X为所述目标位置上对象的准确率,L为所述目标位置上同类对象中、置信度最大的对象对应的置信度,k为同类对象的数量与所述目标位置上所有参考识别结果中对象的数量之间的比值,N为加权值最大的参考识别结果中所述目标位置上的对象的预设补偿值。结合第一方面第六种可能的实现方式或第七种可能的实现方式,在第一方面第八种可能的实现方式中,所述方法还包括:根据所述目标识别结果中包含的对象的置信度信息,获取所述目标识别结果的加权值;判断所述目标识别结果的加权值是否小于预设加权阈值;当所述目标识别结果的加权值小于所述预设加权阈值时,获取所述目标区域的新增帧图像的识别结果,并返回执行获取每个所述识别结果中所述对象的置信度信息,所述新增帧图像与至少两帧所述图像中任意一个都不同;当所述目标识别结果的加权值不小于所述预设加权阈值时,输出所述目标识别结果。第二方面,本申请还提供了一种图像识别装置,包括:识别结果获取单元,用于获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象,所述对象包括:数字、字母、汉字和符号中的一种或多种组合;置信度信息获取单元,用于获取每个所述识别结果中所述对象的置信度信息,所述对象的置信度信息包括:对象的最小置信度、平均置信度和/或数量置信度;目标识别结果获取单元,用于根据所述置信度信息,获取目标识别结果。结合第二方面,在第二方面第一种可能的实现方式中,所述目标识别结果获取单元包括:第一预设权值获取单元,用于获取与所述置信度信息对应的预设权值;第一加权值获取单元,用于根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;第一目标识别结果确认单元,用于将加权值最大的所述识别结果确定为目标识别结果。结合第二方面第一种可能的实现方式,在第二方面第二种可能的实现方式中,所述第一目标识别结果确认单元,包括:第一参考结果获取单元,用于获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;第一区域获取单元,用于获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个本文档来自技高网...
图像识别方法、装置及电子设备

【技术保护点】
一种图像识别方法,其特征在于,包括:获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象;获取每个所述识别结果中所述对象的置信度信息;根据所述置信度信息,获取目标识别结果。

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象;获取每个所述识别结果中所述对象的置信度信息;根据所述置信度信息,获取目标识别结果;其中,所述对象的置信度信息包括:对象的最小置信度、平均置信度和/或数量置信度;其中,所述根据所述置信度信息,获取目标识别结果,包括:获取与所述置信度信息对应的预设权值;根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;将加权值最大的所述识别结果确定为目标识别结果;其中,所述将加权值最大的所述识别结果确定为目标识别结果,包括:获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个位于所述识别结果对应图像中的位置,第一区域内相同位置上所有参考识别结果中的对象都相同,第二区域内相同位置上所有参考识别结果中的对象全部不相同或部分不相同;获取所述第一区域与所述第二区域的长度的比值;判断所述长度比值是否大于预设长度比值阈值;当所述长度比值大于预设长度比值阈值时,将加权值最大且标示出所述第一区域和第二区域的所述识别结果确定为目标识别结果。2.根据权利要求1所述的方法,其特征在于,所述对象包括:数字、字母、汉字和符号中的一种或多种组合。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:判断所述目标识别结果的加权值是否小于预设加权阈值;当所述目标识别结果的加权值小于预设加权阈值时,获取所述目标区域的新增帧图像的识别结果,并返回执行获取每个所述识别结果中所述对象的置信度信息,所述新增帧图像与至少两帧所述图像中任意一个都不同;当所述目标识别结果的加权值不小于预设加权阈值时,输出所述目标识别结果。4.一种图像识别方法,其特征在于,包括:获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象;获取每个所述识别结果中所述对象的置信度信息;根据所述置信度信息,获取目标识别结果;其中,所述对象的置信度信息包括:对象的最小置信度、平均置信度和/或数量置信度;其中,所述根据所述置信度信息,获取目标识别结果,包括:获取与所述置信度信息对应的预设权值;根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个位于所述识别结果对应图像中的位置,第一区域内相同位置上所有参考识别结果中的对象都相同,第二区域内相同位置上所有参考识别结果中的对象全部不相同或部分不相同;融合所述第二区域内相同位置上所有参考识别结果中的对象得到目标对象,所述目标对象为所有参考结果中相同位置上包含的所有对象中的一个;将包含所述第一区域内的对象和所述第二区域内融合后得到的目标对象的识别结果确定为目标识别结果;其中,所述融合所述第二区域内相同位置上所有参考识别结果中的对象得到目标对象,包括:在所述第二区域内选择一个位置作为目标位置;获取所述目标位置上的所有参考识别结果中的对象,所述目标位置上包括至少两类对象,同类的对象相同,不同类的对象不相同;根据X=L+M*k+N,获取与加权值最大的参考识别结果中所述目标位置上的对象同类的对象的准确率;根据X=L+M*k,获取与除加权值最大的参考识别结果外的参考识别结果中所述目标位置上的对象同类的对象的准确率;将准确率最大的一类对象确定为所述目标位置上的目标对象;在所述第二区域内选择未被选择为目标位置的位置作为下一个目标位置,直至所述第二区域内不存在未被选择为目标位置的位置,其中,X为所述目标位置上对象的准确率,L为所述目标位置上同类对象中、置信度最大的对象对应的置信度,k为同类对象的数量与所述目标位置上所有参考识别结果中对象的数量之间的比值,N为加权值最大的参考识别结果中所述目标位置上的对象的预设补偿值。5.根据权利要求4所述的方法,其特征在于,所述对象包括:数字、字母、汉字和符号中的一种或多种组合。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述目标识别结果中包含的对象的置信度信息,获取所述目标识别结果的加权值;判断所述目标识别结果的加权值是否小于预设加权阈值;当所述目标识别结果的加权值小于所述预设加权阈值时,获取所述目标区域的新增帧图像的识别结果,并返回执行获取每个所述识别结果中所述对象的置信度信息,所述新增帧图像与至少两帧所述图像任意一个都不同;当所述目标识别结果的加权值不小于所述预设加权阈值时,输出所述目标识别结果。7.一种图像识别装置,其特征在于,包括:识别结果获取单元,用于获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象,所述对象包括:数字、字母、汉字和符号中的一种或多种组合;置信度信息获取单元,用于获取每个所述识别结果中所述对象的置信度信息,所述对象的置信度信息包括:对象的最小置信度、平均置信度和/或数量置信度;目标识别结果获取单元,用于根据所述置信度信息,获取目标识别结果;其中,所述目标识别结果获取单元包括:第一预设权值获取单元,用于获取与所述置信度信息对应的预设权值;第一加权值获取单元,用于根据所述置信度信息和与所述置信度信息对应的预设权值,获取每个所述识别结果的加权值;第一目标识别结果确认单元,用于将加权值最大的所述识别结果确定为目标识别结果;其中,所述第一目标识别结果确认单元,包括:第一参考结果获取单元,用于获取所述识别结果中加权值由大到小的、预设数量个识别结果作为参考识别结果;第一区域获取单元,用于获取所有参考识别结果中的第一区域和第二区域,其中,每个所述识别结果中的对象都有一个位于所述识别结果对应图像中的位置,第一区域内相同位置上所有参考识别结果中的对象都相同,第二区域内相同位置上所有参考识别结果中的对象全部不相同或部分不相同;目标识别结果确定子单元,用于获取所述第一区域与所述第二区域的长度的比值;判断所述长度比值是否大于预设长度比值阈值;当所述长度比值大于预设长度比值阈值时,将加权值最大且标示出所述第一区域和第二区域的所述识别结果确定为目标识别结果。8.根据权利要求7所述的装置,其特征在于,所述装置还包括:第一加权值判断单元,用于判断所述目标识别结果的加权值是否小于预设加权阈值;第一输出单元,用于当所述目标识别结果的加权值不小于预设加权阈值时,输出所述目标识别结果;当所述目标识别结果的加权值小于预设加权阈值时,所述识别结果获取单元还用于获取所述目标区域的新增帧图像的识别结果,所述新增帧图像与至少两帧所述图像任意一个都不同。9.一种图像识别装置,其特征在于,包括:识别结果获取单元,用于获取目标区域的至少两帧图像的识别结果,每个所述识别结果中包含至少一个对象,所述对象包括:数字、字母、汉字和符号中的一种或...

【专利技术属性】
技术研发人员:陈志军张涛王琳张波
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1