The invention relates to an automatic selection method of picture news cover based on deep attention mechanism, which belongs to the field of computer application technology. This method extracts the features of the pictures in the training set, expresses the input pictures as vectors, takes them as the input of the depth attention model, and outputs them as the weighted average of the attention values of all pictures in the same news. Using the weighted average value and the vector representation of the pictures as the input, trains a classifier, and adjusts the parameters of the model by developing the set. Compared with the existing methods, the method of the present invention can automatically select a cover for picture news without manual intervention, save a lot of time and energy for staff, and also save costs for media companies. In addition, when the data of training set, development set and test set are the same, the accuracy evaluation index of the present invention is obviously improved compared with the random algorithm-based and SVM-based image news cover selection methods.
【技术实现步骤摘要】
一种基于深度注意力机制的图片新闻封面自动选择方法
本专利技术涉及一种图片新闻封面自动选择方法,尤其涉及一种基于深度注意力机制的图片新闻封面自动选择方法,属于计算机应用
技术介绍
随着互联网的发展,越来越多的用户选择在互联网上浏览新闻。其中,图片新闻是在展示新闻照片的同时为读者提供短小精悍的文字报道,可以图文并茂、生动形象地表述新闻,具有文字报道所替代不了的优势,深受广大受众的喜爱。图片新闻首先呈献给用户的是其封面。通常,封面是最能代表整个图片新闻内容或最吸引人眼球的一张图片,好的封面能增加新闻的点击量和浏览量,对图片新闻的关注度与传播起着非常重要的作用。图片新闻封面的选择,主要是依靠新闻网站的编辑等工作人员的精心选择。然而,在新闻媒体如此便利的今天,新闻的数量呈爆炸式增长,图片新闻封面的选择无疑要耗费编辑等工作人员大量的时间。现有的一种简单的省时省力的解决方法是:用随机算法随机选择图片新闻中的一幅图片作为其封面,但是,用这种方法选择出的新闻封面的质量具有随机性,达不到封面需要具备吸引用户眼球、增加点击量的要求。目前还没有更合适的能适用于海量图片新闻的自动 ...
【技术保护点】
1.一种基于深度注意力机制的图片新闻封面自动选择方法,其特征在于,包括以下步骤:步骤一,进行相关定义,具体如下:定义1:训练集,指用于训练的图片新闻的数据集合,记为Tran;定义2:开发集,指在模型训练过程中用于特征函数参数调优的数据集合,记为Dev;定义3:测试集,指用于测试的图片新闻的数据集合,记为Test;定义4:输入图片,特指图片新闻中的图片,用像素矩阵表示;一条图片新闻中,第i张图片记为Ii定义5:图片特征提取,将输入图片I表示成固定维度向量的模型函数,记为f;其中,一条图片新闻中,第i张图片的向量表示记为pi,即pi=f(Ii);定义6:深度注意力机制,松散地基 ...
【技术特征摘要】
1.一种基于深度注意力机制的图片新闻封面自动选择方法,其特征在于,包括以下步骤:步骤一,进行相关定义,具体如下:定义1:训练集,指用于训练的图片新闻的数据集合,记为Tran;定义2:开发集,指在模型训练过程中用于特征函数参数调优的数据集合,记为Dev;定义3:测试集,指用于测试的图片新闻的数据集合,记为Test;定义4:输入图片,特指图片新闻中的图片,用像素矩阵表示;一条图片新闻中,第i张图片记为Ii定义5:图片特征提取,将输入图片I表示成固定维度向量的模型函数,记为f;其中,一条图片新闻中,第i张图片的向量表示记为pi,即pi=f(Ii);定义6:深度注意力机制,松散地基于人类的视觉注意机制,指在选择图片新闻的封面时按照高注意力聚焦在某张或某几张图片上,并以低注意力感知其他图片的模式,通过训练模型,不断地调整聚焦的图片;定义7:深度注意力机制的query,深度注意力模型的一个输入向量,记为q;query为需要被分类的图片特征向量;定义8:对齐模型,衡量深度注意力机制输入端各图片对所在图片新闻的影响程度,记为e=a(q,p);定义9:注意力值,对齐模型用函数t进行归一化之后的值,记为α;定义10:加权平均,特指计算注意力值与输入图片的向量表示的加权平均的函数,记为E;定义11:反向传播算法,对深度注意力机制的损失函数用梯度下降法进行迭代优化求极小值的过程;定义12:分类器,特指将输入图片分成两类的二分类模型,输出图片属于每一类的概率0或者1,记为D,其中,0代表是封面,1代表不是封面;定义13:图片新闻的标签向量,记为L,指示图片新闻的标签位置,例如,若某条图片新闻有5张图片,其中第2张图片为该条新闻的封面,图片新闻的标签向量应表示为:L={0,1,0,0,0};定义14:交叉熵,衡量模型输出与标签向量之间差...
【专利技术属性】
技术研发人员:毛先领,唐翼琨,史学文,黄河燕,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。