基于AI的视频生成方法、装置和电子设备制造方法及图纸

技术编号:35909365 阅读:17 留言:0更新日期:2022-12-10 10:48
本公开提出了一种基于AI的视频生成方法、装置和电子设备,涉及深度学习、自然语言处理等人工智能领域,方法包括从原始素材视频中提取目标主体词;根据目标主体词,从原始素材视频中识别目标主体词的目标描述元素,和目标描述元素的目标描述信息;根据目标描述元素和目标描述元素的目标描述信息,获取目标主体词的描述段落;基于描述段落,对原始素材视频进行剪辑,以生成目标视频。本公开中,避免了对已录制完成的原始素材视频的资源浪费,基于AI对原始素材视频的目标主体词进行提取,并根据提取到的目标主体词对原始素材视频进行视频剪辑,节约了人工成本,提高了视频剪辑的效率。提高了视频剪辑的效率。提高了视频剪辑的效率。

【技术实现步骤摘要】
基于AI的视频生成方法、装置和电子设备


[0001]本公开涉及图像处理领域,尤其涉及深度学习、自然语言处理等人工智能领域,适用于视频剪辑场景。

技术介绍

[0002]随着社会的发展,视频营销成为了一种新型的营销方式,在进行视频营销的过程中,商家可以通过自身注册的官方账号在开放的视频平台上发布商品的视频作品,基于发布的视频作品向用户进行信息的传输。
[0003]实现中,开放的视频平台存在其设定的视频发布标准,在该场景下,商家已录制好的视频作品存在可能无法满足视频平台的视频发布标准,从而导致商家的已录制好的视频作品无法在开放的视频平台上进行发布,造成了商家的资源浪费。
[0004]相关技术中,可以通过人工基于商家的视频发布需求,制作满足视频发布标准的视频作品,对于商家来说,人工成本较高且效率较低。

技术实现思路

[0005]本公开提出了一种基于AI的视频生成方法、装置和电子设备。
[0006]根据本公开的第一方面,提出了一种基于AI的视频生成方法,方法包括:从原始素材视频中提取目标主体词;根据所述目标主体词,从所述原始素材视频中识别所述目标主体词的目标描述元素,和所述目标描述元素的目标描述信息;根据所述目标描述元素和所述目标描述元素的目标描述信息,获取所述目标主体词的描述段落;基于所述描述段落,对所述原始素材视频进行剪辑,以生成目标视频。
[0007]根据本公开的第二方面,提出了一种基于AI的视频生成装置,装置包括:提取模块,用于从原始素材视频中提取目标主体词;识别模块,用于根据所述目标主体词,从所述原始素材视频中识别所述目标主体词的目标描述元素,和所述目标描述元素的目标描述信息;获取模块,用于根据所述目标描述元素和所述目标描述元素的目标描述信息,获取所述目标主体词的描述段落;剪辑模块,用于基于所述描述段落,对所述原始素材视频进行剪辑,以生成目标视频。
[0008]根据本公开的第三方面,提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的基于AI的视频生成方法。
[0009]根据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面所述的基于AI的视频生成方法。
[0010]根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面所述的基于AI的视频生成方法。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1为本公开一实施例的基于AI的视频生成方法的流程示意图;
[0014]图2为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0015]图3为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0016]图4为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0017]图5为本公开一实施例的目标视频的组成示意图;
[0018]图6为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0019]图7为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0020]图8为本公开另一实施例的提取目标主体词的流程示意图;
[0021]图9为本公开一实施例的视频生成终端的页面示意图;
[0022]图10为本公开另一实施例的视频生成终端的页面示意图;
[0023]图11为本公开另一实施例的基于AI的视频生成方法的流程示意图;
[0024]图12为本公开另一实施例的视频生成终端的页面示意图;
[0025]图13为本公开一实施例的基于AI的视频生成装置的结构示意图;
[0026]图14为本公开一实施例的电子设备的示意性框图。
具体实施方式
[0027]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]深度学习(Deep Learning,DL),深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文本,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文本、图像和声音等数据。
[0029]自然语言处理(Natural Language Processing,NLP),是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。
[0030]人工智能(Artificial Intelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智
能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
[0031]图1为本公开一实施例的基于AI的视频生成方法的流程示意图,如图1所示,该方法包括:
[0032]S101,从原始素材视频中提取目标主体词。
[0033]实现中,用户的物体介绍视频存在可能不满足视频平台的发布标准,比如时长过长等相关情况导致无法在相关的开放视频平台上进行发布。在该场景下,可以基于用户已经录制完成的物体介绍视频,进行二次的剪辑处理,生成可以在相关的开放视频平台上正常发布的视频作品。
[0034]可选地,可以基于AI技术对用户已录制完成的物体介绍视频进行相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AI的视频生成方法,其中,所述方法包括:从原始素材视频中提取目标主体词;根据所述目标主体词,从所述原始素材视频中识别所述目标主体词的目标描述元素,和所述目标描述元素的目标描述信息;根据所述目标描述元素和所述目标描述元素的目标描述信息,获取所述目标主体词的描述段落;基于所述描述段落,对所述原始素材视频进行剪辑,以生成目标视频。2.根据权利要求1所述的方法,其中,所述根据所述目标描述元素和所述目标描述元素的目标描述信息,获取所述目标主体词的描述段落,包括:识别所述目标描述元素和所述目标描述元素的目标描述信息的描述表达式;基于所述描述表达式,对所述目标描述元素和所述目标描述元素的目标描述信息进行组合,获取所述目标主体词的描述语句;根据所述描述语句,生成所述目标主体词的描述段落。3.根据权利要求2所述的方法,其中,所述基于所述描述表达式,对所述目标描述元素和所述目标描述元素的目标描述信息进行组合,获取所述目标主体词的描述语句,包括:根据所述描述表达式,确定所述描述语句的语句模板;根据所述语句模板,对所述目标描述元素和所述目标描述元素的目标描述信息进行整合,以生成所述目标主体词的所述描述语句。4.根据权利要求3所述的方法,其中,所述根据所述语句模板,对所述目标描述元素和所述目标描述元素的目标描述信息进行整合,以生成所述目标主体词的所述描述语句,包括:获取所述语句模板中待填充的空白语句成分;根据所述空白语句成分,从所述目标描述元素和所述目标描述元素的目标描述信息中,提取所述空白语句成分的目标字符;将所述目标字符填充至所述空白语句成分在所述语句模板中的填充位置,以生成所述目标主体词的所述描述语句。5.根据权利要求2所述的方法,其中,所述识别所述目标描述元素和所述目标描述元素的目标描述信息的描述表达式,包括:识别所述目标描述元素的目标描述信息的描述信息类型和描述信息数量;根据所述描述信息类型和/或所述描述信息数量,识别所述目标描述元素和所述目标描述元素的目标描述信息的所述描述表达式。6.根据权利要求2所述的方法,其中,所述根据所述描述语句,生成所述目标主体词的描述段落,包括:获取所述描述段落的段落模板,并确定所述段落模板中的空白段落成分;从所述描述语句中确定所述空白段落成分的目标语句,并将所述目标语句填充至所述空白段落成分在所述段落模板中的填充位置,以生成所述目标主体词的所述描述段落。7.根据权利要求1所述的方法,其中,所述基于所述描述段落,对所述原始素材视频进行剪辑,以生成目标视频,包括:根据所述描述段落获取视频文案;
根据所述视频文案对所述原始素材视频进行编辑,以生成所述目标视频。8.根据权利要求7所述的方法,其中,所述根据所述描述段落,获取视频文案,包括:获取视频引言和视频结束语;根据所述视频引言、所述视频结束语和所述描述段落,获取所述视频文案。9.根据权利要求8所述的方法,其中,所述获取视频引言和视频结束语,包括:获取开放视频资源集,并根据所述开放视频资源集识别视频引言模板和视频结束语模板;获取所述视频引言模板中待填充的空白引言成分,根据所述空白引言成分,生成所述目标主体词的引言元素,并将所述引言元素填充至所述视频引言模板的填充位置,以生成所述视频引言;获取所述视频结束语模板中待填充的空白结束语成分,根据所述空白结束语成分,生成所述目标主体词的结束语元素,并将所述结束语元素填充至所述视频结束语模板的填充位置,以生成所述视频结束语。10.根据权利要求7所述的方法,其中,所述根据所述视频文案对所述原始素材视频进行编辑,以生成所述目标视频,包括:根据所述目标主体词,提取视频标题;根据所述原始素材视频,确定视频封面;根据所述视频文案,获取解说音频、视频字幕和背景音乐;根据所述视频文案对所述原始素材视频进行视频剪辑,获取图像素材;对所述视频标题、所述视频封面、所述解说音频、所述视频字幕、所述背景音乐和所述图像素材进行视频编辑,以生成所述目标视频。11.根据权利要求1所述的方法,其中,所述根据所述目标主体词,从所述原始素材视频中识别所述目标主体词的目标描述元素,以及所述目标描述元素的目标描述信息,包括:从所述原始素材视频的初始描述元素中,获取与所述目标主体词关联的候选描述元素;根据所述候选描述元素,从所述原始素材视频中提取所述候选描述元素的候选描述信息;识别所述候选描述元素中的异常描述元素,并过滤掉所述异常候选描述元素,以得到所述目标主体词的目标描述元素,并从所述候选描述信息中获取所述目标描述元素的目标描述信息。12.根据权利要求11所述的方法,其中,所述识别所述候选描述元素中的异常描述元素,包括:识别所述候选描述信息与所属的候选描述元素不匹配的第一异常描述信息,并确定所述第一异常描述信息所属的第一异常描述元素;获取所述候选描述信息与所述目标视频的选题主体词的描述关联度,并获取所述描述关联度小于或者等于关联度阈值的第二异常描述信息,并确定所述第二异常描述信息所属的第二异常描述元素;根据所述第一异常描述元素和所述第二异常描述元素,获取所述候选描述元素中的所述异常描述元素。
13.根据权利要求11所述的方法,其中,所述从所述原始素材视频的初始描述元素中,获取与所述目标主体词关联的候选描述元素之前,包括:从所述原始素材视频中,识别第一初始描述元素和所述第一初始描述元素的第一初始描述信息;对所述第一初始描述信息进行语义识别,将语义相同的第一初始描述信息各自所属的第一初始描述元素进行整合,得到所述原始素材视频的所述初始描述元素,并从语义相同的第一初始描述信息中确定所述初始描述元素的初始描述信息。14.根据权利要求11所述的方法,其中,所述从所述原始素材视频的初始描述元素中,获取与所述目标主体词关联的候选描述元素之前,包括:从所述原始素材视频中,识别第二初始描述元素和所述第二初始元素的第二初始描述信息;将所述第二初始元素作为所述初始描述元素,并将属于同一初始描述元素的全部第二初始描述信息中语义相同的第二初始描述信息进行整合,以得到所述初始描述元素的初始描述信息。15.根据权利要求1所述的方法,其中,所述从原始素材视频中提取目标主体词,包括:获取选题主体词;识别所述原始素材视频中的关联对象,并确定所述关联对象在所述原始素材视频中的关联主体词;根据所述选题主体词和所述关联主体词,确定所述目标主体词。16.根据权利要求15所述的方法,其中,所述根据所述选题主体词和所述关联主体词,确定所述目标主体词,包括:获取所述关联主体词和所述选题主体词的语义关联度;根据所述语义关联度,从所述关联主体词中获取与所述选题主体词关联的候选主体词,并根据所述候选主体词确定所述目标主体词。17.根据权利要求16所述的方法,其中,所述识别所述原始素材视频中的关联对象,并确定所述关联对象在所述原始素材视频中的关联主体词,包括:识别所述原始素材视频的所述关联对象的关联对象主体词,并根据所述关联对象在所述原始素材视频中的出现频次,确定所述关联对象主体词的关联数量;根据所述关联数量,从所述关联对象主体词中确定所述关联对象在所述原始素材视频中的所述关联主体词。18.根据权利要求17所述的方法,其中,所述根据所述关联数量,从所述关联对象主体词中确定所述关联对象在所述原始素材视频中的所述关联主体词,包括:响应于全部的关联对象主体词各自的关联数量存在差异,确定关联数量最多的关联对象主体词,作为所述关联对象在所述原始素材视频中的所述关联主体词;响应于全部的关联对象主体词各自的关联数量相同,随机选择至少一个关联对象主体词,作为所述关联对象在所述原始素材视频中的所述关联主体词。19.根据权利要求15

18任一项所述的方法,其中,所述方法还包括:响应于识别到所述原始素材视频不存在关联对象,获取所述原始素材视频的素材名称,并根据所述素材名称确定所述关联主体词。
20.根据权利要求1

18中任一项所述的方法,其中,所述从原始素材视频中提取目标主体词之前,包括:获取...

【专利技术属性】
技术研发人员:候志强
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1