基于场景的视觉辅助信息确定方法、系统、设备及存储介质技术方案

技术编号：34399323 阅读：22 留言：0更新日期：2022-08-03 21:37

本公开实施例提供了一种基于场景的视觉辅助信息确定方法、系统、设备及存储介质，涉及人工智能技术领域，用以解决相关技术中存在的助盲系统难以基于使用者实际所处环境进行感知及决策的技术问题。涉及的基于场景的视觉辅助信息确定方法，包括：获取目标对象当前所处场景的图像；根据所述图像提取所述图像特征；获取与所述场景关联的问题文本；根据所述问题文本提取问题文本特征；根据所述图像特征与所述问题文本特征之间的相关性确定所述问题文本对应的视觉辅助信息。本公开实施例实现了对目标对象所处环境的认知和推理，达到了代替目标对象对其所处场景进行识别的目的，提高了视觉辅助效果。觉辅助效果。觉辅助效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于场景的视觉辅助信息确定方法、系统、设备及存储介质

[0001]本公开涉及人工智能
，具体而言，涉及一种基于场景的视觉辅助信息确定方法、系统、设备及存储介质。

技术介绍

[0002]目前，视障人士与助盲系统的交互大多是根据自身需求基于自然语言模态信息的交互，但由于视障人士无法获知其所处场景的信息，这种交互通常无法满足视障人士在某些特殊场景下的需求。一些助盲系统主要回答一些结构化信息或者自然语言问答的任务，只涉及到对自然语言的处理及识别，并不考虑视障人士实际所处的场景信息，故无法实现基于实际场景对视障人士的问题进行回答。如，大多数助盲系统多依赖于互联网搜索功能，在大多数情况下对用户提出问题的回答只是单纯的互联网搜索结果的呈现，无法满足用户的实际需求。或者，一些助盲系统使用计算机视觉中的目标检测技术来检测路障或寻找物品，但该种方式停留在对物体简单的识别检测上，难以对使用者所处环境的进行感知及决策。

技术实现思路

[0003]本公开实施例提供一种基于场景的视觉辅助信息确定方法、系统、设备及存储介质，以用于至少部分地解决相关技术中存在的助盲系统难以基于使用者实际所处环境进行感知及决策的技术问题。
[0004]根据本公开的第一个方面，提供了一种基于场景的视觉辅助信息确定方法，包括：获取目标对象当前所处场景的图像；根据所述图像提取所述图像特征；获取与所述场景关联的问题文本；根据所述问题文本提取问题文本特征；根据所述图像特征与所述问题文本特征之间的相关性确定所述问题文本对应的视觉辅助信息。
...

【技术保护点】

【技术特征摘要】
1.一种基于场景的视觉辅助信息确定方法，其特征在于，包括：获取目标对象当前所处场景的图像；根据所述图像提取所述图像特征；获取与所述场景关联的问题文本；根据所述问题文本提取问题文本特征；根据所述图像特征与所述问题文本特征之间的相关性确定所述问题文本对应的视觉辅助信息。2.根据权利要求1所述的方法，其特征在于，获取与所述场景关联的问题文本，包括：根据所述图像对所述场景进行识别，得到场景信息；根据所述场景信息生成与所述场景关联的问题文本。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取针对所述问题文本的反馈信息；若所述反馈信息表明所述问题文本无效，获取第一语音信息；根据所述第一语音信息转换得到与所述场景关联的问题文本。4.根据权利要求2所述的方法，其特征在于，根据所述场景信息生成与所述场景关联的问题文本，包括：获取工作模式信息；若所述工作模式信息表明当前工作模式为主动提问工作模式，根据所述场景信息确定与所述场景相似度高于阈值的历史场景；根据与所述历史场景对应的历史问题文本生成与所述场景关联的问题文本。5.根据权利要求1所述的方法，其特征在于，获取与所述场景关联的问题文本，包括：获取工作模式信息；若所述工作模式信息表明当前工作模式为被动提问工作模式，获取第二语音信息；根据所述第二语音信息转换得到与所述场景关联的问题文本。6.根据权利要求1所述的方法，其特征在于，根据所述问题文本提取问题文本特征，包括：根据预设概念词汇表确定所述问题文本中的关键词对应的概念，其中，所述预设概念词汇表中定义了图像中的对象、图像中对象的属性以及图像中对象之间的关系对应的语义嵌入概念；根据所述问题文本中的关键词对应的概念，提取所述问题文本特征。7.根据权利要求1所述的方法，其特征在于，根据所述图像提取所述图像特征，包括：将所述图像转化为概率图，所述概率图包括节点以及边，所述节点与所述图...

【专利技术属性】
技术研发人员：王昊，李伟，谢碧霄，姚旭杨，刘振华，胡婕，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人