【技术实现步骤摘要】
一种基于细粒度特征提取的图像理解方法
[0001]本专利技术属于图像处理
,特别是涉及一种基于细粒度特征提取的图像理解方法。
技术介绍
[0002]图像理解是根据图像给出能够描述图像内容的自然语言语句,它类似于看图说话,即直接描述看到的图像内容。图像理解技术的本质是从视觉到语言的翻译,这对于人类来说是一件比较简单的任务,但对于机器来说却极具挑战。与人类直接看到的图像、文本信息不同,机器接收到的信息都是二进制的数据,在它看来并无明显区别,因此让它在两种不同形式的信息之间进行翻译是十分困难的。近几年随着人工智能中深度学习技术的发展,结合深度卷积神经网络和循环神经网络的技术在图像理解方面取得了成功。对于输入的图像,该技术能够生成较为准确的文本描述。图像理解技术目前正朝着全方位理解的方向去发展,即对输入图像的各个区域内容进行文本描述从而实现图像内容的充分理解。图像充分理解技术能够较好的帮助人们更好的理解图像内容,发现一些人们不易观察到的细节内容。这对于提高图像理解技术的实用性以及推广相关图像理解系统和软件均具有良好的促进作用。 ...
【技术保护点】
【技术特征摘要】
1.一种基于细粒度特征提取的图像理解方法,其特征在于,包括步骤:S10,对输入图像进行特征提取;S20,基于提取特征进行图像子区域定位,对每一个子定位区域提取对应的区域特征;然后基于所述区域特征生成各自的区域描述信息;S30,将所有区域描述信息进行统一的整合生成针对于输入图像内容的长文本描述。2.根据权利要求1所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤S10中:利用卷积神经网络对对输入图像进行特征提取,获取输入图像的特征。3.根据权利要求2所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤S20中:通过区域建议网络将输入图像的特征进行图像子区域定位。4.根据权利要求3所述的一种基于细粒度特征提取的图像理解方法,其特征在于,在所述步骤S...
【专利技术属性】
技术研发人员:俞文心,张志强,丁劲皓,凌德玉,车璐,龚俊,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。