【技术实现步骤摘要】
一种针对低分辨率绘本图像的检索方法
[0001]本专利技术涉及绘本检索
,具体涉及一种针对低分辨率绘本图像的检索方法。
技术介绍
[0002]随着人工智能的发展,越来越多的绘本阅读机器人推向市面,通过识别卡片、书籍上的内容,例如识别各种形状交通工具、类人机器人、乐器、动植物等内容后,检索出与识别内容相关的多模态输出数据,同时以语音播报、动作呈现和/或屏幕显示等形式输出相关联的多模态数据,从而提升用户的认知能力。绘本阅读机器人将印刷品检索技术相结合,使得机器人具有了与检索印刷品图片相关信息的交互能力,加强了机器人在图片检索等领域的应用。
[0003]然而,绘本阅读机器人在进行内容识别过程中,常常受到图片质量、拍摄环境条件影响,而采集到不同清晰度质量的图像数据,从而影响图像的多模态输出数据检索的正确率,使得绘本阅读机器人输出的数据常与采集的内容不匹配,大大影响了用户的体验感。所以,为了提高检索的准确率,一般会提高采集设备的图像采集的准确性,或者对所采集的图像进行处理,以提高采集图片的分辨率,然后再将其与图库中的图像 ...
【技术保护点】
【技术特征摘要】
1.一种针对低分辨率绘本图像的检索方法,其特征在于:所述方法包括特征图库构建和图像检索两部分;所述特征图库构建具体如下:对绘本图像集中的绘本图像进行抽稀处理,降低其分辨率,得到低分辨率绘本图像集;将低分辨率的绘本图像集中的绘本图像输入到卷积神经网络中;该卷积神经网络具有多个输出分支,每个输出分支输出一特征图;各输出的特征图尺度不同、大小不同,通道数目不同;选取卷积神经网络的部分或全部输出分支输出的特征图,进行上采样后进行融合处理;采用注意力机制对融合后的特征图进行过滤处理,得到三维特征图;将三维特征图进行广义平均池化处理,得到一维特征图,再经过L2正则化处理,即得到最终的特征图;低分辨率的绘本图像集中的所有绘本图像对应的特征图构成特征图库;所述图像检索如下:接收用户上传的绘本图像;将接收的绘本图像输入到卷积神经网络中;...
【专利技术属性】
技术研发人员:陈奇川,
申请(专利权)人:厦门绘可听软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。