基于深度学习的新闻视频细粒度标签智能提取方法技术

技术编号：25270914 阅读：25 留言：0更新日期：2020-08-14 23:04

本发明专利技术涉及一种基于深度学习的新闻视频细粒度标签智能提取方法，利用新闻视频多动态特征进行细粒度的关键帧图片标签提取然后到视频标签汇总提取的方法。目的在于通过人工智能技术与机器训练的方法，对非结构化的视频数据进行结构化的分析，根据视音频的镜头信息、场景信息、语音信息及文字信息，智能生成的视频内容摘要提取，通过算法解析从而实现了自动的对新闻节目的视频标签生成，解决了新闻视音频的快速视频标签提取，极大的提高了新闻视频的二次加工以及传播效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的新闻视频细粒度标签智能提取方法
本专利技术涉及新闻视频提取，具体涉及一种基于深度学习的新闻视频细粒度标签智能提取方法。
技术介绍
随着广播电视、互联网视听节目、短视频等视频网站的发展，视频节目播出的数量也逐年激增，节目视频资料种类繁多、包罗万象。政治、经济、任务、新闻、文艺、体育、教育、健康、法制、科技、青少等等，触及社会各个领域。由于存储的容量和编目不规整的限制，面临视频库的容量爆炸及热点事件查找不易的问题。目前对视频的管理大多采用人工编目标注的方式，由大量的人工进行视频标签的抽取，人力对海量的视频处理，无法从节目层精确到镜头层，也造成了人力资源的浪费，花费成倍的时间来完成编目的制作，也无法有效的对海量的视频进行有效的再次利用和加工。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种基于深度学习的新闻视频细粒度标签智能提取方法，利用新闻视频多动态特征进行细粒度的关键帧图片标签提取然后到视频标签汇总提取的方法。目的在于通过人工智能技术与机器训练的方法，对非结构化的视频数据进行结构化的分析，根据视音频的镜头信息、场景信息、语音信息及文字信息，智能生成的视频内容摘要提取，通过算法解析从而实现了自动的对新闻节目的视频标签生成，解决了新闻视音频的快速视频标签提取，极大的提高了新闻视频的二次加工以及传播效率。本专利技术的目的是通过以下技术方案来实现的：一种基于深度学习的新闻视频细粒度标签智能提取方法，该方法包括：S1：从视频中提取固定数量的关键帧；...

【技术保护点】
1.一种基于深度学习的新闻视频细粒度标签智能提取方法，其特征在于，该方法包括：/nS1：从视频中提取固定数量的关键帧；/nS2：通过与训练好的图片标签模型库对关键帧生成相应的文本描述，提取文本特征得到该关键帧的初步关键帧短词；/nS3：将得到的初步关键帧短词使用HULAC算法进行中文切词，根据预定义的不同词性划分成不同的词组分类；/nS4：基于词语分类熵过滤的TF-IDF算法对S3中的词组数据计算词频，得出相应标签出现的热度次数，根据词语的分类熵设置不同的权重系数来修正TF-IDF值，得到该关键帧标签的热度信息；/nS5：将各标签安装热度值排序，将热度值较高的前N个标签作为该关键帧的标签输出；/nS6：重复S2-S5完成各关键帧图像的标签输出，得到视频的多维细粒度标签集合。/n

【技术特征摘要】
1.一种基于深度学习的新闻视频细粒度标签智能提取方法，其特征在于，该方法包括：
S1：从视频中提取固定数量的关键帧；
S2：通过与训练好的图片标签模型库对关键帧生成相应的文本描述，提取文本特征得到该关键帧的初步关键帧短词；
S3：将得到的初步关键帧短词使用HULAC算法进行中文切词，根据预定义的不同词性划分成不同的词组分类；
S4：基于词语分类熵过滤的TF-IDF算法对S3中的词组数据计算词频，得出相应标签出现的热度次数，根据词语的分类熵设置不同的权重系数来修正TF-IDF值，得到该关键帧标签的热度信息；
S5：将各标签安装热度值排序，将热度值较高的前N个标签作为该关键帧的标签输出；
S6：重复S2-S5完成各关键帧图像的标签输出，得到视频的多维细粒度标签集合。

2.根据权利要求1所述的基于深度学习的新闻视频细粒度标签智能提取方法，其特征在于，所述关键...

【专利技术属性】
技术研发人员：柴焱，黄正兵，陈利涛，钟忆，
申请(专利权)人：成都云帆数联科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人