一种图像描述生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:43829514 阅读:14 留言:0更新日期:2024-12-31 18:29
本申请公开了一种图像描述生成方法、装置、计算机设备及存储介质,属于人工智能技术领域。本申请通过获取待处理图像,并对待处理图像进行图像分割,得到若干个图像块;基于若干个图像块构建图像块序列,并对图像块序列进行编码,得到图像特征向量;获取待处理图像对应的图像内容文本,并对图像内容文本进行编码,得到文本特征向量;基于图像特征向量和文本特征向量,构建特征向量组合;将特征向量组合导入预训练的图像描述生成模型,输出待处理图像的图像描述结果。本申请还涉及区块链技术领域,待处理图像存储在区块链网络中。本申请通过利用预训练模型减少了大规模数据集和计算资源的需求,显著降低了计算成本,提高了模型的可访问性。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种图像描述生成方法、装置、计算机设备及存储介质


技术介绍

1、图像描述是一项结合了计算机视觉(computer v i s i on)和自然语言处理(natura l language process i ng)的技术,旨在使计算机具有“看图说话”的能力。具体来说,图像描述技术能够根据图像所呈现的视觉信息,生成与之相对应的自然语言描述。这一过程不仅要求计算机能够识别出图像中的物体、场景、动作等要素,还需要理解这些要素之间的相互关系,并将这些信息以人类可理解的自然语言形式表达出来。

2、随着深度学习技术的发展,尤其是卷积神经网络在图像识别和特征提取方面的突破,以及transformer模型的发展应用,图像描述生成逐渐成为可能。通过训练模型识别图像中的物体、场景、动作等元素,并将其转化为连贯、准确的文本描述,这项技术不仅能够辅助视觉障碍者更好地理解周围环境,还能在艺术创作、教育、广告和娱乐等多个领域发挥重要作用。

3、然而,这项技术的快速发展也面临巨大的挑战。例如,目前的图像描述方案需要使用大规模模型和数本文档来自技高网...

【技术保护点】

1.一种图像描述生成方法,其特征在于,包括:

2.如权利要求1所述的图像描述生成方法,其特征在于,所述获取待处理图像,并对所述待处理图像进行图像分割,得到若干个图像块的步骤,具体包括:

3.如权利要求2所述的图像描述生成方法,其特征在于,所述基于若干个所述图像块构建图像块序列,并对所述图像块序列进行编码,得到图像特征向量的步骤,具体包括:

4.如权利要求2所述的图像描述生成方法,其特征在于,所述获取所述待处理图像对应的图像内容文本,并对所述图像内容文本进行编码,得到文本特征向量的步骤,具体包括:

5.如权利要求2所述的图像描述生成方法,其特...

【技术特征摘要】

1.一种图像描述生成方法,其特征在于,包括:

2.如权利要求1所述的图像描述生成方法,其特征在于,所述获取待处理图像,并对所述待处理图像进行图像分割,得到若干个图像块的步骤,具体包括:

3.如权利要求2所述的图像描述生成方法,其特征在于,所述基于若干个所述图像块构建图像块序列,并对所述图像块序列进行编码,得到图像特征向量的步骤,具体包括:

4.如权利要求2所述的图像描述生成方法,其特征在于,所述获取所述待处理图像对应的图像内容文本,并对所述图像内容文本进行编码,得到文本特征向量的步骤,具体包括:

5.如权利要求2所述的图像描述生成方法,其特征在于,所述图像处理模型还包括解码层和全连接层,所述基于所述图像特征向量和所述文本特征向量,构建特征向量组合的步骤,具体包括:

6.如权...

【专利技术属性】
技术研发人员:李俊杰邓怿莹陈闽川王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1