【技术实现步骤摘要】
本专利技术涉及图像分割,具体是涉及一种基于层次化提示与方向性线索的零样本指称图像分割方法。
技术介绍
1、指称图像分割(referring image segmentation)旨在精确分割图像中由自然语言描述指定的目标区域。这个过程需要图像和文本之间的精确对齐,以及对视觉和文本元素的全面理解。这在视觉语言领域提出了一个重大挑战。此外,生成精确的掩码注释和相应的自然语言描述既耗时又昂贵,手工注释中的错误可能会影响最终结果。为了解决这些问题,研究人员探索了弱监督方法。然而这种方法性能很差,仍然依赖高质量的训练数据集。相比之下,零样本指称图像分割是一种无需依赖像素级注释,可以准确识别与指称表达式最相关的掩码的方法。这个过程包括掩码的生成和掩码与文本的匹配,这对于生成精确、高质量的掩码和探索视觉文本关系至关重要,使其更具吸引力和研究价值。
2、最近多模态预训练模型在视觉和语言理解方面表现出了令人印象深刻的能力。特别值得注意的是视觉语言模型clip,它擅长捕捉文本和图像之间的全局相似性。它在各种图像级零样本任务(包括图像检索、目标检
...【技术保护点】
1.一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所述层次化提示掩码生成网络集成:Recognize Anything Plus Model(RAM++)、Grounding DINO和Segment Anything in High Quality(HQ-SAM)三种高级模型。
3.根据权利要求2所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所述步骤S1具体包括以下步骤:
4
...【技术特征摘要】
1.一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所述层次化提示掩码生成网络集成:recognize anything plus model(ram++)、grounding dino和segment anything in high quality(hq-sam)三种高级模型。
3.根据权利要求2所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所述步骤s1具体包括以下步骤:
4.根据权利要求3所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所述步骤s2具体包括以下步骤:
5.根据权利要求4所述的一种基于层次化提示与方向性线索的零样本指称图像分割方法,其特征在于,所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。