基于树型结构的多尺度残差网络的新闻画面属性识别方法技术

技术编号：27194840 阅读：37 留言：0更新日期：2021-01-31 11:46

本发明专利技术公开了一种基于树型结构的多尺度残差网络的新闻画面属性识别方法，包括步骤：S1，标注新闻画面属性类别、层级定义及数据；S2，标注后，构建新闻画面属性通用的多尺度残差网络模型；S3，根据步骤S1标注的数据，使用步骤S2构建的模型训练更新其参数；S4，根据步骤S1定义的层级关系，构造预测树，用于新闻画面属性识别等；本发明专利技术高效，可实现自动化、高精度识别新闻画面属性，同时具备可扩展性，实现了满足实际工程应用场景的需要。满足实际工程应用场景的需要。满足实际工程应用场景的需要。

全部详细技术资料下载

【技术实现步骤摘要】
基于树型结构的多尺度残差网络的新闻画面属性识别方法

[0001]本专利技术涉及新闻画面属性分类领域，更为具体的，涉及一种基于树型结构的多尺度残差网络的新闻画面属性识别方法。

技术介绍

[0002]新闻视频作为一种重要的新闻资讯传播手段，相比起通过报纸、电台、广播等作为传播载体的新闻资讯传播方式，往往具有对新闻事件描述更加直观和具现化的特性。其中，新闻视频包含的视觉信息，更是能够提供诸多的有用属性、标签，帮助各电视台、自媒体从业者根据各种属性、标签对新闻素材进行分门别类，构建自有的新闻素材库，方便重用。随着近几年，互联网的高速发展，各种自媒体的蓬勃发展，新闻资讯数量呈现几何式增长，传统的人工标注素材建库入库流程就显得非常繁琐且效率尤为低下，一种自动化、高精度、高效率以及具备可扩展性的新闻素材属性、标签提取技术就显得十分必要。
[0003]卷积神经网络由多层感知机（MLP）演变而来，由于其具有局部区域连接、权值共享、降采样等结构特点，使得卷积神经网络在图像处理领域表现出色。而残差网络通过引入捷径链接，将输入跨层传递与卷积结果相加，使得训练一个深度很深的卷积神经网络成为可能。虽然其在各个学术领域诸如图像分类、目标检测、语意分割等都取得了相较于传统计算机视觉算法更加优越的性能，但在实际工程应用中，依然存在着诸多问题：（1）针对实际的工程应用场景，往往需要对现有的网络模型结构进行微调甚至重新设计。
[0004]（2）神经网络由于其自身的特性，天然有利于解决闭集问题，且性能表现优异。但实际工程应用场景，往往需要解...

【技术保护点】

【技术特征摘要】
1.一种基于树型结构的多尺度残差网络的新闻画面属性识别方法，其特征在于，包括步骤：S1，标注新闻画面属性类别、层级定义及数据；S2，标注后，构建新闻画面属性通用的多尺度残差网络模型；S3，根据步骤S1标注的数据，使用步骤S2构建的模型训练更新其参数；S4，根据步骤S1定义的层级关系，构造预测树，用于新闻画面属性识别。2.根据权利要求1所述的基于树型结构的多尺度残差网络的新闻画面属性识别方法，其特征在于，步骤S1包括：S101，确定新闻画面属性的分类体系，所述分类体系采用多层级类别表示，包括每一层级的详细类别和不同层级的类别之间的隶属关系；S102，根据已经确定的分类体系，获取每个类别的新闻画面图像样本。3.根据权利要求1或2任一所述的基于树型结构的多尺度残差网络的新闻画面属性识别方法，其特征在于，步骤S2包括：S201，以深度残差网络为基础，在每个阶段引入侧向连接，分别记作，将每个阶段特征维度变换到相同维度，分别记作，再自顶向下，递归地对进行上采样和平滑操作，并与相加进行特征融合，得到最终各阶段的融合特征，即：各阶段融合特征如下：其中，x为输入图像，表示输入图像x在网络第n个阶段得到的特征图，；为2D卷积操作，输出通道固定为128，核大小为1，为核大小3*3，输入通道和输出通道相同的2D卷积操作，表示双线性插值上采样2倍；S为平滑操作；S202，根据步骤S1确定的类别层级关系确定每个分类器的类别个数，调整网络的全连接层。4.根据权利要求1所述的基于树型结构的多尺度残差网络的新闻画面属性识别方法，其特征在于，步骤S3包括：S30...

【专利技术属性】
技术研发人员：温序铭，袁琦，袁霞，
申请(专利权)人：成都索贝数码科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人