【技术实现步骤摘要】
本申请属于人工智能,具体涉及一种图像描述生成方法、装置、计算机设备及存储介质。
技术介绍
1、图像描述是一项结合了计算机视觉(computer v i s i on)和自然语言处理(natura l language process i ng)的技术,旨在使计算机具有“看图说话”的能力。具体来说,图像描述技术能够根据图像所呈现的视觉信息,生成与之相对应的自然语言描述。这一过程不仅要求计算机能够识别出图像中的物体、场景、动作等要素,还需要理解这些要素之间的相互关系,并将这些信息以人类可理解的自然语言形式表达出来。
2、随着深度学习技术的发展,尤其是卷积神经网络在图像识别和特征提取方面的突破,以及transformer模型的发展应用,图像描述生成逐渐成为可能。通过训练模型识别图像中的物体、场景、动作等元素,并将其转化为连贯、准确的文本描述,这项技术不仅能够辅助视觉障碍者更好地理解周围环境,还能在艺术创作、教育、广告和娱乐等多个领域发挥重要作用。
3、然而,这项技术的快速发展也面临巨大的挑战。例如,目前的图像描述方案需
...【技术保护点】
1.一种图像描述生成方法,其特征在于,包括:
2.如权利要求1所述的图像描述生成方法,其特征在于,所述获取待处理图像,并对所述待处理图像进行图像分割,得到若干个图像块的步骤,具体包括:
3.如权利要求2所述的图像描述生成方法,其特征在于,所述基于若干个所述图像块构建图像块序列,并对所述图像块序列进行编码,得到图像特征向量的步骤,具体包括:
4.如权利要求2所述的图像描述生成方法,其特征在于,所述获取所述待处理图像对应的图像内容文本,并对所述图像内容文本进行编码,得到文本特征向量的步骤,具体包括:
5.如权利要求2所述的图
...【技术特征摘要】
1.一种图像描述生成方法,其特征在于,包括:
2.如权利要求1所述的图像描述生成方法,其特征在于,所述获取待处理图像,并对所述待处理图像进行图像分割,得到若干个图像块的步骤,具体包括:
3.如权利要求2所述的图像描述生成方法,其特征在于,所述基于若干个所述图像块构建图像块序列,并对所述图像块序列进行编码,得到图像特征向量的步骤,具体包括:
4.如权利要求2所述的图像描述生成方法,其特征在于,所述获取所述待处理图像对应的图像内容文本,并对所述图像内容文本进行编码,得到文本特征向量的步骤,具体包括:
5.如权利要求2所述的图像描述生成方法,其特征在于,所述图像处理模型还包括解码层和全连接层,所述基于所述图像特征向量和所述文本特征向量,构建特征向量组合的步骤,具体包括:
6.如权...
【专利技术属性】
技术研发人员:李俊杰,邓怿莹,陈闽川,王少军,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。