【技术实现步骤摘要】
类别描述的特征信息的获取方法、图像的处理方法及设备
[0001]本申请涉及人工智能领域,尤其涉及一种类别描述的特征信息的获取方法、图像的处理方法及设备。
技术介绍
[0002]视觉语言模型(vision
‑
language model)的最新进展指出,同一类别的图像的特征和语言描述的特征相似,因此,若需要从C个类别中确定图像中物体的类别,可以获取与C个类别中每个类别对应的类别描述,由于同一类别的文本形式的类别描述的特征和图像的特征类似,则可以借助每个类别的类别描述的特征来辅助对图像中物体的识别。
[0003]目前采用的方式是人工设计每种类别的类别描述模板,将人工设计的类别描述模板分别和类别名称组合得到类别描述。作为示例,例如人工设计的类别描述模板为“这是一只XXX”,类别名称为“猫咪”,则类别描述为“这是一只猫咪”。
[0004]但由于人工设计的类别描述模板会引入人为偏见,因此人工设计的类别描述模板对该图像识别任务来说不一定是最优的,且为了能够得到合适的类别描述模板,需要人工重复且耗时的对多个类别描述模板进行尝试。
技术实现思路
[0005]本申请实施例提供了一种类别描述的特征信息的获取方法、图像的处理方法以及相关设备,自动学习每个类别所对应的至少两个类别描述的特征信息,且迭代更新的目标包括提高图像识别任务的准确率,有利于获得与识别任务更为匹配的类别描述;还有利于提高与同一类别中的不同图像的适配度,以进一步提高图像识别过程的准确性。
[0006]为解决上述技术 ...
【技术保护点】
【技术特征摘要】
1.一种类别描述的特征信息的获取方法,其特征在于,所述方法包括:获取与C个类别中每个第一类别对应的至少两个类别描述的特征信息,所述C为大于或等于2的整数,所述第一类别的类别描述包括类别描述模板和所述第一类别;根据每个所述第一类别对应的至少两个类别描述的特征信息和图像的特征信息,生成所述图像的预测类别信息,所述预测类别信息指向的所述图像的预测类别包括于所述C个类别;根据第一损失函数,对与每个第一类别对应的所述至少两个类别描述的特征信息进行更新,直至满足收敛条件,利用所述第一损失函数进行迭代更新的目标包括提高所述预测类别信息和所述图像的正确类别信息之间的相似度。2.根据权利要求1所述的方法,其特征在于,与所述第一类别对应的所述至少两个类别描述的特征信息包括第一特征信息和第二特征信息,所述第一类别的特征信息在所述第一特征信息中的位置和所述第一类别的特征信息在所述第二特征信息中的位置不同。3.根据权利要求1或2所述的方法,其特征在于,所述至少两个类别描述的特征信息包括所述至少两个类别描述的高层特征,所述类别描述的高层特征为神经网络中的隐含层/所述神经网络生成的特征,所述神经网络用于对所述类别描述进行特征更新;所述根据每个所述第一类别对应的至少两个类别描述的特征信息和图像的特征信息,生成所述图像的预测类别信息,包括:根据与所述第一类别对应的至少两个类别描述的高层特征,确定与所述第一类别对应的所述类别描述的高层特征的分布信息;根据每个所述第一类别所对应的所述类别描述的高层特征的分布信息,执行采样操作,得到特征信息集合,所述特征信息集合包括与每个所述第一类别对应的所述高层特征;根据图像的特征信息和所述特征信息集合,生成所述图像的预测类别信息。4.根据权利要求3所述的方法,其特征在于,所述获取与C个类别中每个第一类别对应的至少两个类别描述的特征信息,包括:获取与每个所述第一类别对应的至少两个类别描述的底层特征,所述类别描述的底层特征为向量化形式的所述类别描述;将所述类别描述的底层特征输入所述神经网络,通过所述神经网络对所述类别描述的底层特征进行更新,得到所述类别描述的高层特征;所述对与每个第一类别对应的所述至少两个类别描述的特征信息进行更新,包括:在保持所述神经网络的参数不变的前提下,根据所述第一损失函数的函数值对与所述C个类别对应的至少两个所述类别描述模板的底层特征进行梯度更新,以得到与每个第一类别对应的所述至少两个类别描述的更新后的底层特征。5.根据权利要求1或2所述的方法,其特征在于,所述根据第一损失函数,对与每个第一类别对应的所述至少两个类别描述的特征信息进行更新,包括:根据所述第一损失函数和第二损失函数,对与每个第一类别对应的所述至少两个类别描述的特征信息进行更新,采用所述第二损失函数进行迭代更新的目标包括缩小至少两个类别描述模板的特征信息之间的相似度。6.根据权利要求1或2所述的方法,其特征在于,所述第一损失函数的函数值大于或等于目标函数的函数值,所述目标函数为所述预测类别信息和所述图像的正确类别信息之间
的距离,所述迭代更新的目标包括降低所述第一损失函数的函数值。7.一种图像的处理方法,其特征在于,所述方法包括:对图像进行特征提取,得到所述图像的特征信息;根据与C个类别中每个第一类别对应的类别描述的特征信息和图像的特征信息,生成所述图像的预测类别信息,所述预测类别信息指向的所述图像的预测类别包括于所述C个类别,所述C为大于或等于2的整数;其中,所述第一类别的类别描述包括类别描述模板和所述第一类别,与所述C个类别中每个第一类别对应的特征信息基于每个所述第一类别所对应的至少两个类别描述的特征信息得到,每个所述第一类别所对应的至少两个类别描述的特征信息为利用第一损失函数进行迭代更新后得到,利用所述第一损失函数进行迭代更新的目标包括提高所述预测类别信息和所述图像的正确类别信息之间的相似度。8.根据权利要求7所述的方法,其特征在于,与所述第一类别对应的所述至少两个类别描述的特征信息包括第一特征信息和第二特征信息,所述第一类别的特征信息在所述第一特征信息中的位置和所述第一类别的特征信息在所述第二特征信息中的位置不同。9.根据权利要求7或8所述的方法,其特征在于,与所述C个类别对应的所述类别描述的特征信息是利用所述第一损失函数和第二损失函数进行迭代更新后得到,所述第二损失函数指示至少两个所述类别描述模板的特征信息之间的距离。10.一种类别描述的特征信息的获取装置,其特征在于,所述装置包括:获取模块,用于获取与C个类别中每个第一类别对应的至少两个类别描述的特征信息,所述C为大于或等于2的整数,所述第一类别的类别描述包括类别描述模板和所述第一类别;生成模块,用于根据每个所述第一类别对应的至少两个类别描述的特征信息和图像的特征信息,生成所述图像的预测类别信息,所述预测类别信...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。