【技术实现步骤摘要】
基于深度学习的视频拆条方法
本专利技术涉及媒资管理
,更具体的说,涉及一种基于深度学习的视频拆条方法。
技术介绍
随着电视节目生产全流程的数字化,网络化、信息化以及电视节目的不断发展,积累了大量的多媒体数据,面对海量的多媒体资源无法深度开发和利用以及我国对电视节目的监管要求不断提升,拆条技术应运而生。而互联网的不断发展,使得视频素材量呈现爆炸式增长,直播、小视频、网络电视节目、移动多媒体等不是进行完整的节目播出,而是需要拆分或精简小视频,用户对互联网内容的碎片化需求不断增加,拆条在新媒体中也有越来越广泛的应用。传统拆条方法是人工拆条即人工逐帧预览手工拆条,需要大量的人力投入且效率太低。现有技术是基于云架构的拆条方法,和传统的拆条方式比效率有所提高,在内容产出的时效性和软件成本方面有较大的优势,但需要大量的人力投入,并没有将人力从大量低质量的重复劳动中解放出来。
技术实现思路
有鉴于此,本专利技术提供一种可以降低拆条工作中人力投入的基于深度学习的视频拆条方法,用于解决现有技术中需要大量的人力投入的问题。本专利技术提供了一种基于深度学习的视频拆条方法,包括以下步骤:步骤1:视频数据初始化;步骤2:利用人脸识别技术进行人脸检测,得到连续出现相似人脸的时间片段作为候选拆条片段;步骤3:在候选的拆条片段中,提取声音特征;步骤4:利用声音识别技术和所述声音特征细化候选拆条片段的拆条时间点,得到最终的拆条时间点。可选的,所述步骤1中视频数据初始化包括获取视频数据中的音频波形数据和图像数据。可选的,所述步骤2中的人脸识别技术包括:使用深度学习算法对人脸进行编码,比较视频 ...
【技术保护点】
1.一种基于深度学习的视频拆条方法,其特征在于,包括以下步骤:步骤1:视频数据初始化;步骤2:利用人脸识别技术进行人脸检测,得到连续出现相似人脸的时间片段作为候选拆条片段;步骤3:在候选的拆条片段中,提取声音特征;步骤4:利用声音识别技术和所述声音特征细化候选拆条片段的拆条时间点,得到最终的拆条时间点。
【技术特征摘要】
1.一种基于深度学习的视频拆条方法,其特征在于,包括以下步骤:步骤1:视频数据初始化;步骤2:利用人脸识别技术进行人脸检测,得到连续出现相似人脸的时间片段作为候选拆条片段;步骤3:在候选的拆条片段中,提取声音特征;步骤4:利用声音识别技术和所述声音特征细化候选拆条片段的拆条时间点,得到最终的拆条时间点。2.根据权利要求1所述的基于深度学习的视频拆条方法,其特征在于:所述步骤1中视频数据初始化包括获取视频数据中的音频波形数据和图像数据。3.根据权利要求1所述的基于深度学习的视频拆条方法,其特征在于,所述步骤2中的人脸识别技术包括:使用深度学习算法对人脸进行编码...
【专利技术属性】
技术研发人员:倪攀,姜子琛,彭梅,刘睿,刘宜飞,
申请(专利权)人:杭州星犀科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。