【技术实现步骤摘要】
一种动态场景下基于文本的目标检测方法
本专利技术属于文本目标检测领域,具体涉及一种动态场景下基于文本的目标检测方法。
技术介绍
自2012年深度卷积神经网络在分类任务上取得的成功以来,计算机视觉的研究发展进入了黄金时代。考虑到人机交互的进一步要求得益于,结合计算机视觉与自然语言处理的研究在近年来的热度在不断上升。相对于目标检测,基于文本的目标检测不仅需要计算机理解图像实例的类别和位置信息,还需要计算机在理解文本的基础上,利用实例内部的属性信息和外部的关系信息去预测文本所描述的图像实例。由于基于文本的目标检测实现了图像与自然语言间语义上的对齐,因此对该任务的研究有助于其他更高级任务的实现,如图像检索和视觉问答(VQA)。但现有技术中存在以下问题:新数据到来的同时,旧数据将对模型不可见;模型需要学会所有批次数据包含的知识,直接将现有的基于文本的目标检测模型应用于此任务会出现经典的灾难性遗忘问题,数据学习的越早,模型性能下降越多,遗忘程度越大。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的一种动态场 ...
【技术保护点】
1.一种动态场景下基于文本的目标检测方法,其特征在于,包括以下步骤:/nS1、采集若干文本图像样本对数据,根据文本图像样本对数据的类别将若干文本图像样本对数据分为L个数据集,将每个数据集分为训练集和验证集;/nS2、设定计数器n=1,使用模块化注意网络MattNet进行文本目标检测;/nS3、使用第n批训练集数据对模块化注意网络MattNet训练T次,每次训练使用第n批验证集验证模块化注意网络MattNet,选取T次训练中识别准确率最高的模块化注意网络MattNet作为训练结果;/nS4、构建参数重要程度计算函数,并计算模块化注意网络MattNet中每个参数在第n批训练集上 ...
【技术特征摘要】
1.一种动态场景下基于文本的目标检测方法,其特征在于,包括以下步骤:
S1、采集若干文本图像样本对数据,根据文本图像样本对数据的类别将若干文本图像样本对数据分为L个数据集,将每个数据集分为训练集和验证集;
S2、设定计数器n=1,使用模块化注意网络MattNet进行文本目标检测;
S3、使用第n批训练集数据对模块化注意网络MattNet训练T次,每次训练使用第n批验证集验证模块化注意网络MattNet,选取T次训练中识别准确率最高的模块化注意网络MattNet作为训练结果;
S4、构建参数重要程度计算函数,并计算模块化注意网络MattNet中每个参数在第n批训练集上的第一重要程度;
S5、构建模块重要程度计算函数,并计算模块化注意网络MattNet中每个模块在第n批训练集上的第二重要程度;
S6、根据第一重要程度和第二重要程度构建对前n批训练集数据有记忆约束的网络训练损失函数,并根据训练损失函数约束模块化注意网络MattNet在第n+1批训练集上的训练;
S7、获取第n批训练集中难以迁移的数据,并将其合并至第n+1批训练集中;
S8、以损失函数最小为目标,使用第n+1批训练集数据对模块化注意网络MattNet训练M次,每次训练使用验证集验证模块化注意网络MattNet,选取M次训练中识别准确率最高的模块化注意网络MattNet作为训练结果;
S9、令n的计数值加一,判断n是否等于L,若是,则将此时的网络参数作为模块化注意网络MattNet的最终参数,并进入步骤S10,否则返回步骤S4;
S10、待检测文本图像数据输入模块化注意网络MattNet,得到文本目标检测结果。
2.根据权利要求1所述的动态场景下基于文本的目标检测方法,其特征在于,所述步骤S4中参数重要程度计算...
【专利技术属性】
技术研发人员:宋井宽,谢硕,高联丽,
申请(专利权)人:贵州大学,电子科技大学,
类型:发明
国别省市:贵州;52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。