【技术实现步骤摘要】
多任务协同识别方法及系统本申请要求2018年07月09日提交的申请号为201810746362.3的中国专利技术专利申请的优先权。
本专利技术涉及人工智能的任务识别
,具体涉及一种多任务协同识别方法和系统。
技术介绍
人工智能在以深度神经网络算法为基础,以大数据、云计算、智能终端为支撑,即将进入全面爆发的新纪元。通信带宽的不断增长和传输速度的持续提升,使得海量音/视频数据获取的门槛迅速降低。面对海量数据在存储和处理上超高速、移动化和普适化的迫切需求,传统意义上基于单模态单任务处理的弱人工智能已经成为掣肘该领域发展的主要瓶颈。所谓视听媒体多任务感知识别是指基于生物视听觉感知机理,提取多源异构视听觉信息的通用特征,结合持续性深度层次递归模型,学习出具备长时记忆的时空域共享语义关联信息,实现增强反馈机制下,对不同的视听觉任务的适境感知协同识别结果。例如,一段“小明蹦蹦跳跳到学校说‘老师好!’”的音视频数据中,实现类脑认知下的多种视听觉任务同时识别的效果,即同时识别出场景(学校)、目标(小明)、目标行为(蹦跳)、目标情感(高兴)和目标语言(老师好),而不是传统方法中对每一个识别任务建立一套单独的识别框架,分别输出识别结果,既浪费计算资源,又难以处理海量数据。大数据时代,来源于社交、信息和物理空间不同平台和终端的视听媒体数据呈现出海量异构性,传统基于人工选择特征的模式识别方法已不能满足多任务协同识别的需求。这些多源异构数据又共享着相同的语义信息,具有丰富的潜在关联。以“马”的主题为例,所有图像、视频、音频片段、立体图像和三维模型都可以从互补支撑的角度更好地描述 ...
【技术保护点】
1.一种多任务协同识别方法,其特征在于,包括如下步骤:步骤S110:基于时间同步匹配机制,提取多源异构数据的通用特征,实现所述多源异构数据的通用特征描述;步骤S120:结合基于外部依赖的协同注意机制,将所述通用特征作为先验知识进行训练,生成通用特征间的关联记忆关系;步骤S130:提取多源异构数据的环境感知参数,结合所述关联记忆关系,实现多任务识别。
【技术特征摘要】
2018.07.09 CN 20181074636231.一种多任务协同识别方法,其特征在于,包括如下步骤:步骤S110:基于时间同步匹配机制,提取多源异构数据的通用特征,实现所述多源异构数据的通用特征描述;步骤S120:结合基于外部依赖的协同注意机制,将所述通用特征作为先验知识进行训练,生成通用特征间的关联记忆关系;步骤S130:提取多源异构数据的环境感知参数,结合所述关联记忆关系,实现多任务识别。2.根据权利要求1所述的多任务协同识别方法,其特征在于,所述步骤S110中,所述时间同步匹配机制包括:提取所述多源异构数据的低层特征流,为每个信道的数据建立一个编码概念流,作为复杂事件的参考语义编码,对所述低层特征流与所述参考语义编码进行动态时间规整,产生时间平移函数,实现语义对齐;其中,所述提取所述多源异构数据的低层特征流包括:对音频信号声波采样后,进行频谱变换,构建频谱图;对二维视频信号进行频谱变换,引入共生统计特性得到具有旋转平移不变性的二维时序信号;对三维视频序列,引入多尺度理论进行尺度空间变换,再进行频谱变换和统计共生,生成时序金字塔频谱特征。3.根据权利要求2所述的多任务协同识别方法,其特征在于,步骤S110中,所述提取多源异构数据的通用特征,实现所述多源异构数据的通用特征描述包括:对S类异构特征,将i(i=1,...,S),记为ni个训练样本的特征矩阵,数据噪声部分为E,Γ为旋转因子,建立正交约束下的优化函数为:其中,Xi表示一个特征类型,Θi为Xi的投影矩阵,{Θi}表示通用语义特征子空间,W0表示语义共享矩阵,{Wi}表示特定特征矩阵,R1(W0,{Wi},{Θi})表示损失函数,R2({Θi})表示重构损失函数,R3(W0,{Wi})表示正则函数,λ表示共享矩阵系数,T表示矩阵进行转置运算,Yi表示第i个特征类别标注,F表示Frobenius范数,表示投影矩阵Θi的转置,α、β、μ1和μ2为乘数因子,rank(X)为特征矩阵X的秩,E是噪声矩阵;对多源异构数据中未标注数据的迁移自标注学习,记未标注数据集为迁移学习的标注目标集,使目标集与补充集通过{Θi}联合优化特征自主标注学习,为补充集样本特征描述,{Yia}为补充集标注信息,为目标集样本特征描述,{Yit}为目标集标注信息,迁移自标注学习模型表示如下:其中F(·)是目标函数,ρ是乘数因子,使用三阶段优化算法求解所述迁移自标注学习模型,获得所述通用特征描述。4.根据权利要求3所述的多任务协同识别方法,其特征在于,所述步骤S120具体包括:对通用特征描述集e≤T={e1,e2,…,eT}和对应的隐变量集z≤T={z1,z2,…,zT},使用平移映射ht=fh(ht-1,et,zt)修正每个时间点的确定性隐状态变量ht,先验映射函数fz(ht-1)描述过去观察和隐变量的非线性依赖并提供隐变量分布参数;非线性观察映射函数fe(zt,ht-1)提供依赖于隐变量和状态的似然函数,利用外部记忆模型修正时序变量自动编码器,在每个时间点产生一个记忆文本ψt,得具有关联记忆关系的先验信息和后验信息如下:先验信息pθ(zt|z<T,e<T)=N(zt|fzμ(Ψt),fzσ(Ψt-1))后验信息qφ(zt|z<T,e≤T)=N(zt|fqμ(Ψt-1,et),fqσ(Ψt-1,et)),其中,是隐变量z状态μ的平移映射函数,是隐变量z状态σ的平移映射函数,是后验概率q状态μ的平移映射函数,后验概率q状态σ的平移映射函数,先验信息是依赖于先验映射fz记忆文本的对角高斯分布函数,而对角高斯近似后验分布依赖于通过后验映射函数fq关联的记忆文本Ψt-1和当前观察et。5.根据权利要求4所述的多任务协同...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。