【技术实现步骤摘要】
本申请涉及人工智能及金融,尤其涉及一种图像描述方法和装置、电子设备及存储介质。
技术介绍
1、图像信息描述是一种将图像内容转化为文字描述的技术,可以应用于多种场景,例如在金融领域场景中,用于对海量金融图像进行图像信息描述,建立图像信息库,能够提升图像检索的效率与准确性。
2、目前,主要采用机器学习模型直接对图像进行图像信息生成,然而在实际应用过程中,由于图像的类型繁多,机器学习模型无法精准识别每一幅图像中的核心内容并准确描述图像信息,从而影响了图像描述的准确性。
3、因此,如何提高图像描述的准确性,成为了亟待解决的技术问题。
技术实现思路
1、本申请实施例的主要目的在于提出一种图像描述方法和装置、电子设备及存储介质,旨在提高图像描述的准确性。
2、为实现上述目的,本申请实施例的第一方面提出了一种图像描述方法,所述方法包括:
3、获取原始图像数据和原始图像指示信息;
4、对所述原始图像指示信息进行扩写处理,得到初始图像指示信息;
...【技术保护点】
1.一种图像描述方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述图像嵌入特征和所述文本嵌入特征进行特征融合,得到目标信息嵌入特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述图文变换矩阵进行注意力计算,得到所述目标信息嵌入特征,包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述初始图像指示信息进行文本特征提取,得到文本嵌入特征,包括:
5.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述原始图像数据进行图像特征提取,得到图像嵌入特征,包括
6....
【技术特征摘要】
1.一种图像描述方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述图像嵌入特征和所述文本嵌入特征进行特征融合,得到目标信息嵌入特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述图文变换矩阵进行注意力计算,得到所述目标信息嵌入特征,包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述初始图像指示信息进行文本特征提取,得到文本嵌入特征,包括:
5.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述原始图像数据进行图像特征提取,得到图像嵌入特征,包括:
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:舒畅,陈又新,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。