一种图像识别方法以及相关设备技术

技术编号：37642857 阅读：14 留言：0更新日期：2023-05-25 10:09

一种图像识别方法，包括：输出第一提醒；所述第一提醒指示用户将辅助部位与待识别对象建立位置关联、并控制终端拍摄所述辅助部位；在拍摄的第一图像中存在所述辅助部位，且所述第一图像中存在与所述辅助部位之间位置关系满足第一预设条件的目标对象的情况下，根据采集的第二图像，得到所述目标对象的识别结果；其中，所述第一图像和所述第二图像为在所述输出第一提醒之后所述用户控制所述终端拍摄的视频流中的图像，所述第二图像的采集时间在所述第一图像之后。本申请通过提示用户将辅助部位和待识别对象之间建立位置关联，减少了用户动作成本的同时也提高了识别的效率。动作成本的同时也提高了识别的效率。动作成本的同时也提高了识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像识别方法以及相关设备

[0001]本申请涉及图像处理领域，尤其涉及一种图像识别方法以及相关设备。

技术介绍

[0002]在日常生活中，视障人士在近场环境下有许多文字信息识别的需求，例如快递单上的收件人信息，药品说明书上的名称及用法用量等。目前，利用光学字符识别(optical character recognition，OCR)技术和语音合成(text to speech，TTS)技术可以使视障人士通过终端设备获取到近场的文字信息，但是视障人士在使用搭载了OCR技术和TTS技术的信息识别软件时，由于缺少视觉反馈信息，还是会出现拍不到、拍不全、拍不清的问题。
[0003]因此，现有技术开始探索如何帮助视障人士使用图像捕获设备准确完整地读取到想要识别的区域中的文字信息。在一种现有的实现中，通过实时监测当前画面中文件的完整情况，从而计算出用户应该移动手机的方向与距离，并使用语音引导用户。
[0004]然而，用户需要在4自由度下移动(3个位移自由度，1个转动自由度)，如“向前移动1英尺”“向左移动1英尺”，“旋转到五点钟方向”在移动时容易偏移目标，出错率较高，对于盲人用户来说，无法精准量化自己移动的距离和旋转的角度，不能做出引导语中的精确动作，有时会造成目标偏离程度反而增大。

技术实现思路

[0005]第一方面，本申请提供了一种图像识别方法，所述方法包括：输出第一提醒；所述第一提醒指示用户将辅助部位与待识别对象建立位置关联、并控制终端拍摄所述辅助部位；在拍摄的第一图像中存在所述辅助部位...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，所述方法包括：输出第一提醒；所述第一提醒指示用户将辅助部位与待识别对象建立位置关联、并控制终端拍摄所述辅助部位；在拍摄的第一图像中存在所述辅助部位，且所述第一图像中存在与所述辅助部位之间位置关系满足第一预设条件的目标对象的情况下，根据采集的第二图像，得到所述目标对象的识别结果；其中，所述第一图像和所述第二图像为在所述输出第一提醒之后所述用户控制所述终端拍摄的视频流中的图像，所述第二图像的采集时间在所述第一图像之后。2.根据权利要求1所述的方法，其特征在于，所述辅助部位为手部。3.根据权利要求1或2所述的方法，其特征在于，所述第一预设条件包括如下的至少一种：所述目标对象与所述辅助部位之间存在重叠；所述目标对象的在所述辅助部位所指示的方向上；所述目标对象为所述第一图像中包括的多个对象中距离所述辅助部位最近的对象。4.根据权利要求1至3任一所述的方法，其特征在于，所述视频流还包括采集时间在所述第一图像之前的第三图像；所述方法还包括：在所述第三图像中不存在满足所述第一预设条件的目标对象时，输出第二提醒，所述第二提醒指示用户解除所述辅助部位与待识别对象的位置关联、或者将所述辅助部位向待识别对象的边缘移动；所述第二图像的采集时间在所述输出第二提醒之后。5.根据权利要求1至4任一所述的方法，其特征在于，所述方法还包括：在所述第一图像中所述目标对象的画面不完整、或者不清晰时，输出第三提醒，所述第三提醒指示用户控制终端远离或者靠近待识别对象；所述第二图像的采集时间在所述输出第三提醒之后。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：基于所述终端在所述远离或者靠近待识别对象时，相比所述远离或者靠近待识别对象之前的姿态差异大于阈值，根据位姿差异所述输出第四提醒，所述第四提醒指示用户控制终端进行姿态调整，且所述姿态调整的调整量与所述位姿差异有关。7.根据权利要求1至6任一所述的方法，其特征在于，所述待识别对象为平面对象，所述第一提醒具体指示用户将辅助部位覆盖到所述待识别对象之上；或者，所述待识别对象为立体对象，所述第一提醒具体指示用户通过所述辅助部位拿起所述待识别对象或者将辅助部位覆盖到所述立体对象的一个面上。8.根据权利要求1至7任一所述的方法，其特征在于，所述方法还包括：在拍摄的第一图像中存在所述辅助部位，且所述第一图像中存在与所述辅助部位之间位置关系满足第一预设条件的目标对象的情况下，输出第五提醒，所述第五提醒指示用户解除所述辅助部位与待识别对象的位置关联；所述第二图像的采集时间在所述输出第五提醒之后。9.根据权利要求1至8任一所述的方法，其特征在于，所述目标对象为屏幕，所述终端上
包括触摸组件；所述识别结果为所述屏幕上目标控件对应的文本内容；所述方法还包括：输出所述文本内容，并接收到用户针对于所述目标控件的选择；根据所述触摸组件和所述目标控件之间的相对位置，输出第六提醒，所述第六提醒指示用户控制终端进行位置调整直至所述触摸组件接触到所述目标控件，且所述位置调整的调整量与所述相对位置有关。10.根据权利要求9所述的方法，其特征在于，所述触摸组件为贴附在终端背面的支架或者所述终端上的一个角点。11.一种图像识别装置，其特征在于，所述装置包括：输出模块，用于输出第一提醒；所述第一提醒指示用户将辅助部位与待识别对象建立位置关联、并控制终端拍摄所述辅助部位；识别模块，用于在拍摄的第一图像中存在所述辅助部位，且所述第一图像中存在与所述辅助部位之间位置关系满足第一预设条件的目标对象的情况下，根据采集的第二图像，得到所述目标对象的识别结果；其中，所述第一图像和所述第二图像为在所述输出第一提醒之后所述用户控制所述终端拍摄的视频流中...

【专利技术属性】
技术研发人员：肖澜，李婷，刘浏，林玮悦，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人