视频处理方法、视频处理装置、电子设备及存储介质制造方法及图纸

技术编号:37115782 阅读:20 留言:0更新日期:2023-04-01 05:11
本申请提供了一种视频处理方法、视频处理装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:对原始视频数据进行人脸识别,得到目标人脸视频帧,并根据目标人脸视频帧,生成目标视频封面;对原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据说话风格特征和语音内容特征,生成目标视频字幕;对原始视频数据进行关键词识别,得到视频关键词,并根据视频关键词确定视频关键节点;基于候选场景数据对视频关键节点进行场景选择,得到视频关键节点对应的目标场景数据;基于目标视频封面、目标视频字幕、目标场景数据对原始视频数据进行剪辑处理,得到目标视频数据。本申请能够使得目标视频数据更加符合用户需求。户需求。户需求。

【技术实现步骤摘要】
视频处理方法、视频处理装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种视频处理方法、视频处理装置、电子设备及存储介质。

技术介绍

[0002]随着网络技术的发展,视频处理技术被广泛用于短视频平台等多种业务场景,而常用的视频处理方法常常需要基于人工处理的方式对视频进行剪辑,这一方式往往需要依赖于操作人员的操作水平,存在着一定的误操作风险,会影响剪辑的视频质量,因此,如何提高生成视频的准确性,成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种视频处理方法、视频处理装置、电子设备及存储介质,旨在提高生成视频的准确性,使得目标视频数据更加符合用户需求。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种视频处理方法,所述方法包括:
[0005]获取原始视频数据;
[0006]对所述原始视频数据进行人脸识别,得到目标人脸视频帧,并根据所述目标人脸视频帧,生成目标视频封面;
[0007]对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据所述说话风格特征和所述语音内容特征,生成目标视频字幕;
[0008]对所述原始视频数据进行关键词识别,得到视频关键词,并根据所述视频关键词确定视频关键节点;
[0009]基于预设的候选场景数据对所述视频关键节点进行场景选择,得到每一视频关键节点对应的目标场景数据;
[0010]基于所述目标视频封面、所述目标视频字幕、所述目标场景数据对所述原始视频数据进行剪辑处理,得到目标视频数据。
[0011]在一些实施例,所述对所述原始视频数据进行人脸识别,得到目标人脸视频帧,并根据所述目标人脸视频帧,生成目标视频封面,包括:
[0012]基于预设的人脸识别模型对所述原始视频数据进行人脸识别,得到初始人脸视频帧;
[0013]对所述初始人脸视频帧进行筛选,得到目标视频帧;
[0014]基于预设的视频标题、所述目标视频帧进行封面生成,得到所述目标视频封面。
[0015]在一些实施例,所述对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据所述说话风格特征和所述语音内容特征,生成目标视频字幕,包括:
[0016]基于预设的语音识别模型对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征;
[0017]基于所述说话风格特征对预设的候选展示模板进行筛选,得到目标展示模板;
[0018]基于所述目标展示模板对所述语音内容特征进行布局处理,得到所述目标视频字幕。
[0019]在一些实施例,所述对所述原始视频数据进行关键词识别,得到视频关键词,并根据所述视频关键词确定视频关键节点,包括:
[0020]对所述原始视频数据进行文本内容提取,得到视频文本数据;
[0021]对所述视频文本数据进行分词处理,得到多个视频文本词段;
[0022]基于预设算法对所述视频文本词段进行关键词识别,得到所述视频关键词;
[0023]根据预设的词语类型对所述视频关键词进行风格标注,得到标签关键词;
[0024]基于所述标签关键词的风格标签信息和词语位置信息,确定所述视频关键节点。
[0025]在一些实施例,所述基于预设的候选场景数据对所述视频关键节点进行场景选择,得到每一视频关键节点对应的目标场景数据,包括:
[0026]获取所述视频关键节点的词语特征;
[0027]基于所述词语特征对所述候选场景数据进行筛选,得到所述视频关键节点的目标场景数据,其中,所述目标场景数据包括目标场景动画和目标场景音效。
[0028]在一些实施例,所述基于所述目标视频封面、所述目标视频字幕、所述目标场景数据对所述原始视频数据进行剪辑处理,得到目标视频数据,包括:
[0029]根据所述目标场景数据、所述目标视频字幕对所述原始视频数据进行渲染处理,得到渲染视频数据;
[0030]将所述视频封面添加至所述渲染视频数据,得到所述目标视频数据。
[0031]在一些实施例,在所述基于所述目标视频封面、所述目标视频字幕、所述目标场景数据对所述原始视频数据进行剪辑处理,得到目标视频数据之后,所述方法还包括:
[0032]获取用于指示发布操作的触发请求;
[0033]根据所述触发请求生成视频审批提醒信息,将所述视频审批提醒信息发送至审核端;
[0034]获取所述审核端根据所述视频审批提醒信息反馈的审批反馈数据,其中,所述审批反馈数据包括用于指示批准所述发布操作的同意发布信息;
[0035]根据所述同意发布信息执行所述发布操作,以将所述目标视频数据发送至目标对象。
[0036]为实现上述目的,本申请实施例的第二方面提出了一种视频处理装置,所述装置包括:
[0037]数据获取模块,用于获取原始视频数据;
[0038]封面生成模块,用于对所述原始视频数据进行人脸识别,得到目标人脸视频帧,并根据所述目标人脸视频帧,生成目标视频封面;
[0039]字幕生成模块,用于对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据所述说话风格特征和所述语音内容特征,生成目标视频字幕;
[0040]关键节点确定模块,用于对所述原始视频数据进行关键词识别,得到视频关键词,并根据所述视频关键词确定视频关键节点;
[0041]场景选择模块,用于基于预设的候选场景数据对所述视频关键节点进行场景选
择,得到每一视频关键节点对应的目标场景数据;
[0042]剪辑模块,用于基于所述目标视频封面、所述目标视频字幕、所述目标场景数据对所述原始视频数据进行剪辑处理,得到目标视频数据。
[0043]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
[0044]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
[0045]本申请提出的视频处理方法、视频处理装置、电子设备及存储介质,其通过获取原始视频数据;对原始视频数据进行人脸识别,得到目标人脸视频帧,并根据目标人脸视频帧,生成目标视频封面,能够较好地符合视频剪辑的封面剪辑需求,提高了用户的使用体验。进一步地,对原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据说话风格特征和语音内容特征,生成目标视频字幕,能够使得原始视频数据中的语音内容可以以目标视频字幕的形式清楚地呈现出来。进一步地,对原始视频数据进行关键词识别,得到视频关键词,并根据视频关键词确定视频关键节点;基于预设的候选场景数据对视频关键节点进行场景选择,得到每一视频关键节点对应的目标场景数据,能够较为方便地提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,其特征在于,所述方法包括:获取原始视频数据;对所述原始视频数据进行人脸识别,得到目标人脸视频帧,并根据所述目标人脸视频帧,生成目标视频封面;对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据所述说话风格特征和所述语音内容特征,生成目标视频字幕;对所述原始视频数据进行关键词识别,得到视频关键词,并根据所述视频关键词确定视频关键节点;基于预设的候选场景数据对所述视频关键节点进行场景选择,得到每一视频关键节点对应的目标场景数据;基于所述目标视频封面、所述目标视频字幕、所述目标场景数据对所述原始视频数据进行剪辑处理,得到目标视频数据。2.根据权利要求1所述的视频处理方法,其特征在于,所述对所述原始视频数据进行人脸识别,得到目标人脸视频帧,并根据所述目标人脸视频帧,生成目标视频封面,包括:基于预设的人脸识别模型对所述原始视频数据进行人脸识别,得到初始人脸视频帧;对所述初始人脸视频帧进行筛选,得到目标视频帧;基于预设的视频标题、所述目标视频帧进行封面生成,得到所述目标视频封面。3.根据权利要求1所述的视频处理方法,其特征在于,所述对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征,并根据所述说话风格特征和所述语音内容特征,生成目标视频字幕,包括:基于预设的语音识别模型对所述原始视频数据进行语音识别,得到语音内容特征和说话风格特征;基于所述说话风格特征对预设的候选展示模板进行筛选,得到目标展示模板;基于所述目标展示模板对所述语音内容特征进行布局处理,得到所述目标视频字幕。4.根据权利要求1所述的视频处理方法,其特征在于,所述对所述原始视频数据进行关键词识别,得到视频关键词,并根据所述视频关键词确定视频关键节点,包括:对所述原始视频数据进行文本内容提取,得到视频文本数据;对所述视频文本数据进行分词处理,得到多个视频文本词段;基于预设算法对所述视频文本词段进行关键词识别,得到所述视频关键词;根据预设的词语类型对所述视频关键词进行风格标注,得到标签关键词;基于所述标签关键词的风格标签信息和词语位置信息,确定所述视频关键节点。5.根据权利要求1所述的视频处理方法,其特征在于,所述基于预设的候选场景数据对所述视频关键节点进行场景选择,得到每一视频关键节点对应的目标场景数据,包括:获取所述视频关键节点的词语特征;...

【专利技术属性】
技术研发人员:温梦
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1