图像处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39932139 阅读:25 留言:0更新日期:2024-01-08 21:54
本申请涉及一种图像处理方法、装置、计算机设备、存储介质和计算机程序产品,涉及人工智能领域。方法包括:获取目标图像,并将目标图像输入至预训练的文本生成模型,得到用于描述目标图像所呈现内容的目标文本;将目标文本输入至预训练的文本扩充模型,通过预训练的文本扩充模型根据与目标文本的文本主体构成匹配的文本扩充模板,对目标文本进行文本内容扩充,得到用于描述目标图像所呈现内容的扩充后文本;输出扩充后文本。采用本方法能够在针对图像生成描述文本时,提高生成文本的质量。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种图像处理方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着信息处理技术的发展,出现了图生文技术。图生文技术是指让计算机根据一幅图像自动生成完整而流畅的文字描述声明。图生文任务将计算机视觉和自然语言处理紧密联系在一起,是人工智能领域中的一个基本问题。

2、目前大多数图生文技术直接根据图像输入进行文本输出,导致生成的文本不够具体,可能存在生成的文本与图像的主题不符合、描述不够生动的问题。

3、因此,相关技术在针对图像生成描述文本时,存在生成文本质量低的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够在针对图像生成描述文本时,提高生成文本的质量的图像处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种图像处理方法,包括:

3、获取目标图像,并将所述目标图像输入至预训练的文本生成模型,得到用于描述所述目标图像所呈现内容的目标文本;</p>

4、将所本文档来自技高网...

【技术保护点】

1.一种图像处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标文本输入至预训练的文本扩充模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述目标文本的文本主体构成包括主体词语;所述通过所述预训练的文本扩充模型根据与所述目标文本的文本主体构成匹配的文本扩充模板,对所述目标文本进行文本内容扩充,得到用于描述所述目标图像所呈现内容的扩充后文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述确定与所述文本主体构成匹配的文本扩充模板,作为目标文本扩充模板,包括:

5.根据权利要求4所述的方法...

【技术特征摘要】

1.一种图像处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标文本输入至预训练的文本扩充模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述目标文本的文本主体构成包括主体词语;所述通过所述预训练的文本扩充模型根据与所述目标文本的文本主体构成匹配的文本扩充模板,对所述目标文本进行文本内容扩充,得到用于描述所述目标图像所呈现内容的扩充后文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述确定与所述文本主体构成匹配的文本扩充模板,作为目标文本扩充模板,包括:

5.根据权利要求4所述的方法,其特征在于,所述确定所述文本主体构成所属的文本主体类别,包括:

6.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:陈梦菲
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1