当前位置: 首页 > 专利查询>哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院专利>正文

一种图像的文本描述信息生成方法技术

技术编号：39405258 阅读：12 留言：0更新日期：2023-11-19 15:57

本申请公开了一种图像的文本描述信息生成方法，该图像的文本描述信息生成方法包括获取目标图像的图像特征、目标图像中目标物体的物体特征以及目标图像中目标区域的区域特征，目标区域基于目标图像中的目标物体确定；基于自适应注意机制对目标图像的图像特征进行处理，得到目标图像的全局表示；对目标物体的物体特征以及目标区域的区域特征进行局部感知处理，得到目标图像的局部表示；基于全局表示和局部表示进行解码处理，得到目标图像的目标文本描述信息。上述方案，能够提高文本描述信息生成的准确性。息生成的准确性。息生成的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像的文本描述信息生成方法

[0001]本申请涉及计算机视觉与图像处理
，特别是涉及一种图像的文本描述信息生成方法。

技术介绍

[0002]图像的文本描述信息生成作为计算机视觉领域受到广泛关注的技术，生成有意义并具有个性化的描述文本不仅需要算法能够识别图像中包含的对象，还需要获得这些对象之间的关系，而且还要用合理的语言表达出来。
[0003]目前，通过识别图像中的对象，并根据图像特征和对象特征确定图像的文本描述信息，导致所生成的文本描述信息无法关注到图像中的准确信息，进而导致生成的文本描述信息准确率低下的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种图像的文本描述信息生成方法，能够提高文本描述信息的准确性。
[0005]为解决上述技术问题，本申请采用的一个技术方案是：提供一种图像的文本描述信息生成方法，所述方法包括：获取目标图像的图像特征、所述目标图像中目标物体的物体特征以及所述目标图像中目标区域的区域特征，所述目标区域基于所述目标图像中的目标物体确定；基于自适应注意机制对所述目标图像的图像特征进行处理，得到所述目标图像的全局表示；对所述目标物体的物体特征以及所述目标区域的区域特征进行局部感知处理，得到所述目标图像的局部表示；基于所述全局表示和所述局部表示进行解码处理，得到所述目标图像的目标文本描述信息。
[0006]为解决上述技术问题，本申请采用的另一个技术方案是：提供一种图像的文本描述信息生成装置，包括：获取模块，用于获取目标图像的图像特征、...

【技术保护点】

【技术特征摘要】
1.一种图像的文本描述信息生成方法，其特征在于，所述方法包括：获取目标图像的图像特征、所述目标图像中目标物体的物体特征以及所述目标图像中目标区域的区域特征，所述目标区域基于所述目标图像中的目标物体确定；基于自适应注意机制对所述目标图像的图像特征进行处理，得到所述目标图像的全局表示；对所述目标物体的物体特征以及所述目标区域的区域特征进行局部感知处理，得到所述目标图像的局部表示；基于所述全局表示和所述局部表示进行解码处理，得到所述目标图像的目标文本描述信息。2.根据权利要求1所述的图像的文本描述信息生成方法，其特征在于，所述基于自适应注意机制对所述目标图像的图像特征进行处理，得到所述目标图像的全局表示的步骤，包括：对所述目标图像的图像特征进行平均池化和最大池化处理，得到空间注意参数；基于所述空间注意参数和获取的时间注意参数确定自适应注意参数，所述时间注意参数基于所述目标图像中各像素点的注视时间确定的；基于所述自适应注意参数和所述目标图像的图像特征确定所述目标图像的全局表示。3.根据权利要求2所述的图像的文本描述信息生成方法，其特征在于，所述基于所述自适应注意参数和所述目标图像的图像特征确定所述目标图像的全局表示的步骤，包括：将所述自适应注意参数和所述目标图像的图像特征之积作为特征结合表示；对所述特征结合表示和所述目标图像的图像特征进行异或计算，得到异或运算后的特征表示；对所述异或运算后的特征表示进行降维处理，得到所述目标图像的全局表示。4.根据权利要求1所述的图像的文本描述信息生成方法，其特征在于，所述对所述目标物体的物体特征以及所述目标区域的区域特征进行局部感知处理，得到所述目标图像的局部表示的步骤，包括：对所述目标物体的物体特征和所述目标区域的区域特征进行拼接，得到所述目标图像中的顶点以及所述顶点的顶点特征；计算所述目标图像中目标顶点对应的目标物体的物体特征与其它顶点对应的目标物体的物体特征之间的第一余弦相似度，所述其它顶点为以所述目标顶点为中心的预设范围内的顶点；计算所述目标顶点对应的目标区域的区域特征与所述其它顶点对应的目标区域的区域特征之间的第二余弦相似度；基于所述第一余弦相似度、所述第二余弦相似度、所述目标顶点的顶点特征以及所述其它顶点的顶点特征确定所述目标图像的局部表示。5.根据权利要求4所述的图像的文本描述信息生成方法，其特征在于，所述基于所述第一余弦相似度、所述第二余弦相似度、所述目标顶点的顶点特征以及所述其它顶点的顶点特征确定所述目标图像的局部表示的步骤，包括：将所述第...

【专利技术属性】
技术研发人员：徐睿峰，王冰冰，梁斌，巫继鹏，杨敏，
申请(专利权)人：哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人