一种基于查询词的自适应智能生成图文视频缩略图方法技术

技术编号：20025809 阅读：22 留言：0更新日期：2019-01-06 04:39

本发明专利技术公开了一种基于查询词的自适应智能生成图文视频缩略图方法。其中，该方法包括：获取目标视频，进行提取处理，获得所述视频中的音视频信息；对所述音视频信息进行结构化处理，获得结构化的视频数据及结构化后的音频数据；将所述结构化的视频数据进行挑选，获得与查询关键词语义相符的关键帧，即视觉元素；将所述结构化的音频数据进行提取处理，获得与查询关键词语义相关的文本元素；获取视觉元素和文本元素进行动态合成处理，获得图文视频缩略图；获取所述图文视频缩略图，提取所述图文视频缩略图的语义文本，进行全局的配色监控处理，获得与查询关键词语义相关的目标视频图文视频缩略图。实施本发明专利技术实施例，能够通过系统来智能的根据查询关键词自适应生成视频缩略图可以节省人力资源，比现有的自动生成视频缩略图技术更具有目的性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于查询词的自适应智能生成图文视频缩略图方法
本专利技术涉及算法优化与分析、计算机图像图像处理及深度学习
，具体涉及一种基于查询词的自适应智能生成图文视频缩略图方法。
技术介绍
视频缩略图在用户查找视频和做内容相关性评估时起着至关重要的作用。缩略图的选择不仅关系到视频在社交网络中的传播量级，也严重影响者在线浏览者信息获取的即时满足感。然而，从成千上万的视频帧中选择最合适的缩略图是十分耗时且需要技巧的人工过程。尽管目前有一些方法可以自动或半自动的从视频提取缩略图，但是在特定的场景下，如用户需要指定存在视频中的某主题相关的视频缩略图时仍然存在很大的局限性。除此之外，一些自动或者半自动的选择视频缩略图所得到的最终视频缩略图的结果也往往是单帧的图像，这在表达整个视频内容信息上比一些使用动态的视频缩略图在表达的信息量上要低很多。所以在尽可能多的表达信息的同时，又能够满足视频缩略图简单明了的目的同时，大部分现有技术则采用了动态视频缩略图的技术，即采用与视频各个部分主题相关的或者相近的关键帧共同构成几帧动态图用作视频缩略图。但是动态的视频缩略图在存储方面相比单帧的视频缩略图又存在明显的缺陷，显然一张图像的存储空间比多张的动态缩略图的存储空间要小很多，在数量级不大的存储项目中也许这个劣势还不是很明显，但是对于企业级的数量级很大的存储规模上，所占用的存储空间往往也是不能接受的。在现有技术方案中有一种终端及视频动态缩略图的生成方法，用以解决用户在观看视频之前无法了解视频内容的问题，使用户在短时间内获悉视频的主要信息，提高用户体验。为了解决这一问题，在该专利技术中提供...

【技术保护点】
1.一种基于查询词的自适应智能生成图文视频缩略图方法，其特征在于，所述方法包括：获取目标视频，进行提取处理，获得所述视频中的音视频信息；对所述音视频信息进行结构化处理，获得结构化的视频数据及结构化后的音频数据；将所述结构化的视频数据通过关联模型根据语义进行挑选，获得与查询关键词语义相符的关键帧(通常为3‑5帧)，所述关键帧作为待合成的图文视频缩略图的备选帧，即视觉元素；将所述结构化的音频数据利用语言识别技术和自然语言技术进行提取处理，获得与查询关键词语义相关的文本元素；获取视觉元素和文本元素，利用布局算法进行动态合成处理，获得图文视频缩略图；获取所述图文视频缩略图，提取所述图文视频缩略图的语义文本，进行全局的配色监控处理，获得与查询关键词语义相关的目标视频图文视频缩略图。

【技术特征摘要】
1.一种基于查询词的自适应智能生成图文视频缩略图方法，其特征在于，所述方法包括：获取目标视频，进行提取处理，获得所述视频中的音视频信息；对所述音视频信息进行结构化处理，获得结构化的视频数据及结构化后的音频数据；将所述结构化的视频数据通过关联模型根据语义进行挑选，获得与查询关键词语义相符的关键帧(通常为3-5帧)，所述关键帧作为待合成的图文视频缩略图的备选帧，即视觉元素；将所述结构化的音频数据利用语言识别技术和自然语言技术进行提取处理，获得与查询关键词语义相关的文本元素；获取视觉元素和文本元素，利用布局算法进行动态合成处理，获得图文视频缩略图；获取所述图文视频缩略图，提取所述图文视频缩略图的语义文本，进行全局的配色监控处理，获得与查询关键词语义相关的目标视频图文视频缩略图。2.根据权利要求1所述的一种基于查询词的自适应智能生成图文视频缩略图方法，其特征在于，所述对所述音视频信息进行结构化处理的具体步骤包括：检测所述视频的长度，若视频的长度小于60分钟时，则不对视频进行结构化处；若视频的长度大于60分钟时，每隔10帧进行挑选一张图像处理；检测所述视频的帧率，若视频的帧率小于30每帧时，则不对视频进行结构化处理；若视频的帧率大于30每帧时，则每秒按照布场8进行挑选处理；检测所述视频的音频数据，进行降噪处理，随后对于低于10分贝的音频平均音量则进行升调处理。3.根据权利要求1所述的一种基于查询词的自适应智能生成图文视频缩略图方法，其特征在于，所述将所述结构化的音频数据利用语言识别技术和自然语言技术进行提取处理的具体步骤包括：检测所述音频数据中是否含有字幕文件，若含有，则直接使用文本语义分割处理，对分割后的语义段进行去停词，分词处理，获得与查询词语义相关的主题词或主题词语，用作合成图文视频缩略图的文本元素；若无，则进行下一步；从音视频中分离出音频信息，将音频文件转化为非压缩的wav文件，在进行语音识别之前需要将首尾端的静音切除和过滤噪音，降低对后续步骤的干扰；使用音频分类...

【专利技术属性】
技术研发人员：李超，林淑金，周凡，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人