一种面向视障人士的物品智能搜索方法技术

技术编号：28376030 阅读：13 留言：0更新日期：2021-05-08 00:03

本发明专利技术公开了一种面向视障人士的物品智能搜索方法，其步骤包括：1通过基于深度学习的语音识别模型对视障人士的所需物品诉求的关键字进行提取；2构建基于深度学习的目标检测模型；3收集用于视障人士目标检测的生活物品数据集并训练目标检测模型；4搜索目标后，语音输出视障人士诉求物品位置信息。本发明专利技术能通过人工智能识别视障人士的语音诉求，智能化识别并定位物品，从而能帮助视障人士搜索所需物品。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向视障人士的物品智能搜索方法
本专利技术涉及视障人士日常搜索物品方法，特别涉及一种面向视障人士的物品智能搜索方法。
技术介绍
视障人士是社会中占有很大比重的一类弱势群体，视力残疾的他们在生活中面临很多困难，比如搜索物品，视障人士不能分辨物品类别，获取不了物品位置信息，使得难以独自获取物品。2017年全球约有2.53亿人患有视力障碍，其中3600万人失明，2.17亿人患有中度至重度视力障碍。根据第六次全国人口普查我国总人口数和全国第二次残疾人抽样调查结果推算，我国单一视力残疾的人数达1263万，如果包含多重残疾者，视力残疾的患病率为1.53％，视力残疾的人数达2055万。由此可见，在世界范围内视障人士群体数量庞大，在社会中占了很大的比重。帮助视障人士克服视觉困难是涉及民生的重大公共卫生问题和社会问题，随着信息时代的飞速发展，如果不设法缩小由于视力残疾等原因带来的数字鸿沟问题，视障人士将面临越来越严峻的挑战，有日益边缘化的危险，帮助他们克服视觉困难是重大公共卫生问题和社会问题，能极大改善他们的生活质量，减轻家庭和社会负担，同时也能促进社会和谐与稳定，助力社会经济生产活动。目前，国内外面向视障人士服务的研究没有得到足够的关注和重视，一些研究还处于起步阶段，为视障人士设计的服务也仅仅只有诸如导盲犬，盲杖，盲道等简单的工具，并且这些工具不能完全满足视障人士生活中的基本需求。此外，国内外研究者针对视障人士智能服务的研究主要集中在利用地理信息的导盲、基于专用传感器的导航、基于视障人士感知的专用视觉模型的导盲、基于视觉...

【技术保护点】
1.一种面向视障人士的物品智能搜索方法，其特征是按如下步骤进行：/n步骤1、获取视障人士的语音信息并通过深度学习的语音识别模型进行语音与文本的映射，得到匹配的关键字；再对所述关键字进行文本与图像的关系映射，得到匹配的目标图像；/n步骤2、构建基于深度学习的目标检测模型，所述目标检测模型是由多尺度重建模块、语义分割模块及目标检测模块组成；/n步骤2.1、所述多尺度特征重建模块包括：2n个密集卷积块和2n个反卷积层；每个密集卷积块是由m个卷积层跳跃连接构成：/n定义变量i；当i＝1时，所述目标图像经过第i个密集卷积块和i个反卷积层后输出2(

【技术特征摘要】
1.一种面向视障人士的物品智能搜索方法，其特征是按如下步骤进行：
步骤1、获取视障人士的语音信息并通过深度学习的语音识别模型进行语音与文本的映射，得到匹配的关键字；再对所述关键字进行文本与图像的关系映射，得到匹配的目标图像；
步骤2、构建基于深度学习的目标检测模型，所述目标检测模型是由多尺度重建模块、语义分割模块及目标检测模块组成；
步骤2.1、所述多尺度特征重建模块包括：2n个密集卷积块和2n个反卷积层；每个密集卷积块是由m个卷积层跳跃连接构成：
定义变量i；当i＝1时，所述目标图像经过第i个密集卷积块和i个反卷积层后输出2(i)倍尺度特征a2i；当i＝2,3，…，2n时，所述2(i)倍尺度特征a2i经过第i+1个密集卷积块和i+1反卷积层输出2(i+1)倍尺度特征a2(i+1)，从而得到多尺度特征{a2i|i＝1,2,…,2n}；
步骤2.2、所述语义分割模块包括：残差模块、语义分割网络的分支、包含注意力机制的一组卷积层；残差模块也包括一组卷积层；且两组卷积层的参数共享；
步骤2.2.1、将所述多尺度特征{a2i|i＝1,2,…,2n}经过语义分割网络的分支后输出语义多尺度特征{b2i|i＝1,2,…,2n}；
将所述多尺度特征{a2i|i＝1,2,…,2n}经过残差模块中的一组卷积层后输出残差多尺度特征{c2i|i＝1,2,…,2n}；
将所述语义多尺度特征{b2i|i＝1,2,…,2n}与残差多尺度特征{c2i|i＝1,2,…,2n}进行逐点相加操作，得到融合多尺度特征{d2i|i＝1,2,…,...

【专利技术属性】
技术研发人员：赵仲秋，班名洋，田卫东，胡健，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人