视觉素材的处理方法、装置和系统、计算机终端制造方法及图纸

技术编号:33946371 阅读:12 留言:0更新日期:2022-06-29 21:26
本申请公开了一种视觉素材的处理方法、装置和系统、计算机终端。其中,该方法包括:接收视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度;输出视频。本申请解决了相关技术中视觉素材通过人力手动处理,导致成本较高且耗时较长的技术问题。术问题。术问题。

【技术实现步骤摘要】
视觉素材的处理方法、装置和系统、计算机终端


[0001]本申请涉及互联网领域,具体而言,涉及一种视觉素材的处理方法、装置和系统、计算机终端。

技术介绍

[0002]近年来,视频已经成为吸引消费者注意力的主流方式。在电子商务平台中,使用视频作为促销工具是提高商品分享率和销量的可行方法。在视频制作中的核心步骤之一是生成视觉素材序列,但是,目前该步骤由经验丰富的导演执行,整个处理过程成本高昂且耗时较长。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种视觉素材的处理方法、装置和系统、计算机终端,以至少解决相关技术中视觉素材通过人力手动处理,导致成本较高且耗时较长的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种视觉素材的处理方法,包括:接收视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度;输出视频。
[0006]根据本申请实施例的另一方面,还提供了一种视觉素材的处理方法,包括:获取视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度。
[0007]根据本申请实施例的另一方面,还提供了一种视觉素材的处理方法,包括:通过调用第一接口获取视觉素材集合,其中,第一接口包括:第一参数,第一参数的参数值为视觉素材集合,视觉素材均包含了与待推荐的产品关联的产品特征;将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度;通过调用第二接口输出视频,其中,第二接口包括:第二参数,第二参数的参数值为视频。
[0008]根据本申请实施例的另一方面,还提供了一种视觉素材的处理装置,包括:接收模块,用于接收视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;组
合模块,用于将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;筛选模块,用于基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;排序模块,用于基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度;输出模块,用于输出视频。
[0009]根据本申请实施例的另一方面,还提供了一种视觉素材的处理装置,包括:获取模块,用于获取视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;组合模块,用于将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;筛选模块,用于基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;排序模块,用于基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度。
[0010]根据本申请实施例的另一方面,还提供了一种视觉素材的处理装置,包括:第一调用模块,用于通过调用第一接口获取视觉素材集合,其中,第一接口包括:第一参数,第一参数的参数值为视觉素材集合,视觉素材均包含了与待推荐的产品关联的产品特征;组合模块,用于将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;筛选模块,用于基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;排序模块,用于基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,其中,排序因素包括如下至少之一:目标镜头之间的语义距离,目标镜头中产品的显著区域比率和目标镜头之间的相似度;第二调用模块,用于通过调用第二接口输出视频,其中,第二接口包括:第二参数,第二参数的参数值为视频。
[0011]根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述的视觉素材的处理方法。
[0012]根据本申请实施例的另一方面,还提供了一种计算机终端,包括:存储器和处理器,处理器用于运行存储器中存储的程序,其中,程序运行时执行上述的视觉素材的处理方法。
[0013]根据本申请实施例的另一方面,还提供了一种视觉素材的处理系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收视觉素材集合,其中,视觉素材均包含了与待推荐的产品关联的产品特征;将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头;对多个目标镜头进行镜头排序,生成用于推荐产品的视频;输出视频。
[0014]在本申请实施例中,在接收到视觉素材集合之后,可以将视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合,进一步基于产品特征的语义和视觉素材的感知说服力,从候选镜头集合中筛选得到多个目标镜头,并基于排序因素对多个目标镜头进行镜头排序,生成用于推荐产品的视频,并输出给用户查看,实现视频制作的目的。容易注意到的是,可以基于影视制作原理确定不同的排序因素,实现将影视制作知识融合到候选镜头集合筛选和镜头排序过程中,在提取原始视频视觉信息和结构信息的基础上将剪辑手法
建模为优化子模块,从而达到了增强逻辑流程,提升观看体验和感知说服力,更有效地推广产品的技术效果,进而解决了相关技术中视觉素材通过人力手动处理,导致成本较高且耗时较长的技术问题。
附图说明
[0015]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0016]图1是根据本申请实施例的一种用于实现视觉素材的处理方法的计算机终端(或移动设备)的硬件结构框图;
[0017]图2是根据本申请实施例的一种视觉素材的处理方法的流程图;
[0018]图3是根据本申请实施例的一种可选的交互界面的示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视觉素材的处理方法,其特征在于,包括:接收视觉素材集合,其中,所述视觉素材均包含了与待推荐的产品关联的产品特征;将所述视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合;基于产品特征的语义和视觉素材的感知说服力,从所述候选镜头集合中筛选得到多个目标镜头;基于排序因素对所述多个目标镜头进行镜头排序,生成用于推荐所述产品的视频,其中,所述排序因素包括如下至少之一:所述目标镜头之间的语义距离,所述目标镜头中所述产品的显著区域比率和所述目标镜头之间的相似度;输出所述视频。2.根据权利要求1所述的方法,其特征在于,将所述视觉素材集合中的视觉素材以素材序列的方式组成候选镜头集合,包括:采用场景检测模型来分析所述视觉素材集合中的视觉素材,获取所述视觉素材集合中的视觉素材的场景类别,其中,采用卷积神经网络模型训练样本素材生成所述场景检测模型;基于所述视觉素材集合中的视觉素材的场景类别,对所述视觉素材集合进行递归聚类,聚类得到不同类别的多个素材序列;获取以所述素材序列的方式组成的所述候选镜头集合。3.根据权利要求2所述的方法,其特征在于,所述素材序列中包含的视觉素材具有相同的场景类型,且视觉素材的视觉外观相似度超过阀值;不同素材序列之间的场景类型不同。4.根据权利要求3所述的方法,其特征在于,获取以所述素材序列的方式组成的所述候选镜头集合,包括:从所述素材序列中随机选择序列中的第一个视觉素材;从备选素材中选择与所述第一个视觉素材相似度最高的下一个视觉素材,作为相邻素材放置于所述第一个视觉素材所在的素材序列中,且与所述第一个视觉素材的播放位置相邻;对所述素材序列中的每个视觉素材执行迭代选择出相邻的下一个视觉素材,输出所述候选镜头集合。5.根据权利要求1所述的方法,其特征在于,基于产品特征的语义和视觉素材的感知说服力,从所述候选镜头集合中筛选得到多个目标镜头,包括:获取所述候选镜头集合中候选镜头中包含的多个视觉素材;基于每个视觉素材中产品特征的语义,获取所述每个视觉素材之间的语义距离;基于冯特曲线对所述每个视觉素材进行处理,获取所述每个视觉素材的感知说服力;基于所述每个视觉素材之间的语义距离,所述每个视觉素材的感知说服力,以及所述每个视觉素材的场景类别,筛选得到所述多个目标镜头。6.根据权利要求5所述的方法,其特征在于,基于所述每个视觉素材之间的语义距离,所述每个视觉素材的感知说服力,以及...

【专利技术属性】
技术研发人员:刘畅董义申志奇于涵高占宁王攀任沛然谢宣松
申请(专利权)人:南洋理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1