图像描述的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24499333 阅读：38 留言：0更新日期：2020-06-13 04:22

本申请公开了图像描述的方法、装置、电子设备及存储介质，涉及图像处理技术领域。具体实现方案为：获取目标图像；通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征，其中，N为正整数，M为小于或等于N的正整数；根据所述M个基础特征，生成M个基础特征标签；根据所述M个基础特征标签生成所述目标图像的图像描述语句，通过这种方式生成的图像描述语句具有更丰富的表现能力，能够充分表现出目标图像中的信息，提高了图像描述语句的准确性和可靠性。

Methods, devices, electronic devices and storage media of image description

全部详细技术资料下载

【技术实现步骤摘要】
图像描述的方法、装置、电子设备及存储介质
本申请涉及图像处理
，具体涉及计算机视觉
，尤其涉及图像描述的方法、装置、电子设备及存储介质。
技术介绍
图像描述，其目的是从图像中自动生成一段描述性文字，即看图说话。图像描述的过程不仅要能检测出图像中的物体，而且要理解物体之间的相互关系，最后还要用合理的语言表达出来。相关技术中，通常是利用单个识别模型对图像进行识别，以根据识别出的图像的单个特征生成特征标签对图像进行描述，这种方式从图像中识别出的信息较少，生成的特征标签无法充分表现出图像中的信息。
技术实现思路
本申请提出一种图像描述的方法、装置、电子设备及存储介质，生成的图像描述语句具有更丰富的表现能力，能够充分表现出目标图像中的信息，提高了图像描述语句的准确性和可靠性。本申请第一方面实施例提出一种图像描述的方法，该方法包括：获取目标图像；通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征，其中，N为正整数，M为小于或等于N的正整数；根据所述M个基础特征，生成M个基础特征标签；根据所述M个基础特征标签生成所述目标图像的图像描述语句。在本申请一个实施例中，所述根据所述M个基础特征标签生成所述目标图像的图像描述语句，包括：获取应用程序的类别；根据所述应用程序的类别获取所述目标图像的描述模板；将所述M个基础特征标签的至少部分基础特征标签填入所述描述模板以形成所述图像描述语句。在本申请一个实施例中，所述将所述M个基础特征标签的至少部分基...

【技术保护点】
1.一种图像描述的方法，其特征在于，包括：/n获取目标图像；/n通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征，其中，N为正整数，M为小于或等于N的正整数；/n根据所述M个基础特征，生成M个基础特征标签；/n根据所述M个基础特征标签生成所述目标图像的图像描述语句。/n

【技术特征摘要】
1.一种图像描述的方法，其特征在于，包括：
获取目标图像；
通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征，其中，N为正整数，M为小于或等于N的正整数；
根据所述M个基础特征，生成M个基础特征标签；
根据所述M个基础特征标签生成所述目标图像的图像描述语句。

2.如权利要求1所述的图像描述的方法，其特征在于，所述根据所述M个基础特征标签生成所述目标图像的图像描述语句，包括：
获取应用程序的类别；
根据所述应用程序的类别获取所述目标图像的描述模板；
将所述M个基础特征标签的至少部分基础特征标签填入所述描述模板以形成所述图像描述语句。

3.权利要求2所述的图像描述的方法，其特征在于，所述将所述M个基础特征标签的至少部分基础特征标签填入所述描述模板以形成所述图像描述语句，包括：
获取所述M个基础特征标签之间的相关性；
根据所述M个基础特征标签之间的相关性获取相关的第一基础特征标签和第二基础特征标签；
将所述第一基础特征标签、所述第二基础特征标签和其他基础特征标签的至少部分基础特征标签填入所述描述模板以形成所述图像描述语句。

4.如权利要求1所述的图像描述的方法，其特征在于，所述根据所述M个基础特征标签生成所述目标图像的图像描述语句，包括：
获取应用程序的类别；
根据所述应用程序的类别获取所述应用程序对应的描述模型；
将所述M个基础特征标签输入所述描述模型以生成所述目标图像的图像描述语句。

5.如权利要求1所述的图像描述的方法，其特征在于，所述图像识别模型包括人脸识别模型、文字识别模型、分类识别模型、标识识别模型、水印识别模型、菜品识别模型、车牌识别模型、表情识别模型、年龄识别模型、肤色识别模型之中的多种。

6.一种图像描述的装置，其特征在于，包括：
获取模块，用于获取目标图像；
第一生成模块，用于通过N个图像识别模型对所述目标图像进行识别以生成所述目标图像的M个基础特征，其中，N为正整数，M为小于或等于N的正整数；
第二生成模块，用于根据所述M个基础特征，生成M个基础特征标签；
第三生成模块，用于根据所述M个基础特征...

【专利技术属性】
技术研发人员：王震，刘涛，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人