基于知识图谱引导的小样本动作识别方法及系统技术方案

技术编号：38142402 阅读：6 留言：0更新日期：2023-07-08 09:57

本发明专利技术属于动作识别技术领域，涉及基于知识图谱引导的小样本动作识别方法及系统。本发明专利技术的系统面向动作识别的知识图谱构建模块、基于图卷积神经网络的信息传播模块以及动作信息识别模块构成。本发明专利技术通过构建知识图谱和图卷积神经网络训练，将未知动作类别的视频集合分为支持样本和查询样本；通过支持样本和知识图谱得到视频原型特征向量；计算视频原型特征向量与查询样本的视频特征向量之间的余弦相似度，将余弦相似度最大的视频原型特征向量所对应的标签作为预测的动作类别。本发明专利技术提高了小样本动作识别的准确性。小样本动作识别的准确性。小样本动作识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识图谱引导的小样本动作识别方法及系统

[0001]本专利技术属于动作识别
，具体涉及一种基于知识图谱引导的小样本动作识别方法及系统。

技术介绍

[0002]近年来，针对小样本的研究已经吸引了许多国内外顶尖科研机构甚至是国家政府机构的关注。一方面，由于现实中很多应用场景都面临数据难以收集，或者是标注成本高导致的训练数据不足的问题。例如在医疗影像领域，罕见疾病的数据通常难以收集，同时也不容易找到专业人士对数据进行有效标注；在无人驾驶领域，各种突发情况的数据样本尤为稀缺；在金融投资领域，数据通常呈长尾分布，对于尾部场景难以获取足够的训练样本。发展小样本学习的理论与技术，能够帮助深度学习技术在缺少数据的应用场景下落地，在很多领域有着广泛的应用前景。为推动小样本学习技术的发展，在新一代人工智能的研究抢占领先地位，国内外机构纷纷发布了针对小样本学习的研究计划。
[0003]目前针对小样本学习任务，目前已经出现了一些相关的研究工作，并取得了一定的进展。根据方法侧重点的不同，现有方法大致可以分为三类：基于元学习的小样本识别技术，主要研究如何迁移模型在大量学习任务上的学习经验，以实现小样本识别；基于数据增强的小样本识别技术，主要研究如何设计方法扩充有限的数据集，以提升所构建模型的性能；引入语义关系的小样本识别技术，主要通过借助高层语义概念之间的关系，帮助建立视觉概念之间的联系以更好的进行小样本识别。在小样本学习中，先验知识能够帮助模型有效利用已有的学习经验，实现在少量样本上的快速学习。因此，先验知识的引入对于小样本...

【技术保护点】

【技术特征摘要】
1.基于知识图谱引导的小样本动作识别方法，其特征在于，构建用于动作识别的知识图谱，知识图谱包含动作和动作的属性；选取已知动作类别的视频集合作为训练集，将训练集的每个动作类别中选择一部分视频作为支持样本，另一部分视频作为查询样本；通过图卷积神经网络提取知识图谱中所有相关节点的特征，作为知识图谱特征；将知识图谱特征与特征提取网络提取的支持样本的视频特征向量进行点乘，从而使视频特征与知识图谱特征进行交互，得到视频的各种属性特征；将视频的各种属性特征与特征提取网络提取的支持样本的视频特征向量拼接，得到视频原型特征向量FC；特征提取网络提取查询样本的视频特征向量，视频特征向量对应的标签为；计算视频原型特征向量FC与查询样本的视频特征向量的余弦损失；对图卷积神经网络方向传播从而进行训练；将未知动作类别的视频集合分为支持样本和查询样本；通过训练后的图卷积神经网络提取知识图谱中所有相关节点的特征，作为知识图谱特征；将知识图谱特征与特征提取网络提取的支持样本的视频特征向量进行点乘，从而使视频特征与知识图谱特征进行交互，得到视频的各种属性特征；将视频的各种属性特征与特征提取网络提取的支持样本的视频特征向量拼接，得到视频原型特征向量FC；特征提取网络提取查询样本的视频特征向量；计算视频原型特征向量FC与视频特征向量之间的余弦相似度，将余弦相似度最大的视频原型特征向量所对应的标签作为预测的动作类别。2.根据权利要求1所述的基于知识图谱引导的小样本动作识别方法，其特征在于，构建知识图谱的步骤如下：S11.结合动作识别语料库结构化的特点，设计针对动作类别视频的模式层；模式层包含需要从动作语料中所抽取的词语类别，以及它们之间的连接关系；所述词语类别为所有动作类别、动作发生时所处的场景、施加动作的对象、与动作相关的物体；将每个词语作为知识图谱中的节点；将动作类别作为中心，场景、对象、物体作为该动作的属性与动作相连；知识图谱设计为无向图以方便知识传递；S12.利用实体抽取技术从动作识别语料库中抽取出备选实体：使用实体抽取算法从动作识别语料库上关于每个动作的介绍页中抽取出所有实体，之后利用词性选择算法，从所有实体中筛选出动作、场景、对象、物体这四个类别的实体作为备选实体；并且人工从这些备选实体中选出若干与动作类别强相关的词语；S13.根据备选实体与人工选择的实体间词向量的余弦距离，从动作识别语料库中发现与人工选择的实体相近的新实体；S14.使用实体消歧技术，对发现的新实体进行过滤，筛除有歧义的词语，然后再次进行人工的筛选；S15.将视频动作作为中心节点，重要动作属性为普通节点，以动作与属性之间的联系...

【专利技术属性】
技术研发人员：徐波，钟幼平，刘嘉，刘家豪，林谋，丁元，
申请(专利权)人：国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人