【技术实现步骤摘要】
本专利技术属于语义信息提取,具体涉及一种基于多原型学习的场景语义信息提取方法。
技术介绍
1、随着计算机视觉和机器学习技术的快速发展,场景理解作为这些领域核心的研究方向之一,是科研和工业界的研究热点。场景语义信息提取旨在从图像或视频中识别并提取出有意义的语义信息,如物体、事件、关系等,它是许多高级视觉任务的基础,如目标检测、图像分类、语义分割等。此外,有效的场景语义信息提取对于众多现实应用都至关重要,如自动驾驶、机器人导航和增强现实等。
2、传统的场景语义信息提取方法往往基于规则、统计或深度学习等技术。其中,基于规则的方法需要手动编写大量规则,难以应对复杂场景;基于统计的方法对标注数据依赖性较高,且难以捕捉丰富的语义信息;基于深度学习的方法主要采用卷积神经网络(cnn)、循环神经网络(rnn)和图神经网络(gnn)等,这些方法需要在大量标注数据下经过复杂的训练流程,才能在特定场景下展现出良好的性能。然而,当遇到场景变动大、场景中各个类别内部特征丰富多样的复杂情形时,这些方法往往因为缺乏足够的灵活性和适应性,而难以满足现实应用
...【技术保护点】
1.一种基于多原型学习的场景语义信息提取方法,其特征在于,包括以下步骤;
2.根据权利要求1所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(1)具体为:
3.根据权利要求1所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(2)骨干网络通常由卷积层堆叠而成,用于从输入图像提取特征作为步骤(3)的输入,在训练过程中,骨干网络的参数根据步骤(5)中网络输出的结果计算损失进行更新,以优化网络性能。
4.根据权利要求2所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(2)具体为:<
...【技术特征摘要】
1.一种基于多原型学习的场景语义信息提取方法,其特征在于,包括以下步骤;
2.根据权利要求1所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(1)具体为:
3.根据权利要求1所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(2)骨干网络通常由卷积层堆叠而成,用于从输入图像提取特征作为步骤(3)的输入,在训练过程中,骨干网络的参数根据步骤(5)中网络输出的结果计算损失进行更新,以优化网络性能。
4.根据权利要求2所述的一种基于多原型学习的场景语义信息提取方法,其特征在于,所述步骤(2)具体为:
5.根据权利要求4所述的一种基于多原型...
【专利技术属性】
技术研发人员:牛毅,王丹,马明明,李甫,石光明,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。