用于生成视频的方法和装置制造方法及图纸

技术编号:26178860 阅读:25 留言:0更新日期:2020-10-31 14:31
本申请实施例公开了用于生成视频的方法和装置。该方法的一具体实施方式包括:接收用户输入的查询文本;查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;呈现素材资源集合;响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;根据素材资源序列生成视频。该实施方式降低了用户生成视频的成本。

【技术实现步骤摘要】
用于生成视频的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成视频的方法和装置。
技术介绍
目前,用户在制作视频的过程中,往往需要人工拍摄或者制作生成视频所需的各种素材资源(包括视频、音频、图像和字幕文字)。
技术实现思路
本申请实施例提出了用于生成视频的方法和装置。第一方面,本申请实施例提供了一种用于生成视频的方法,该方法包括:接收用户输入的查询文本;查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;呈现素材资源集合;响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;根据素材资源序列生成视频。在一些实施例中,查询与查询文本相关的素材资源集合,包括:对查询文本进行分词,得到与查询文本对应的分词序列;对于分词序列中的分词,查询与该分词的匹配度大于预设匹配度阈值的素材资源;将查找到的素材资源确定为素材资源集合。在一些实施例中,查询与该分词的匹配度大于预设匹配度阈值的素材资源,包括:查询对应的语义向量与该分词的词向量之间的相似度大于第一预设相似度阈值的素材资源。在一些实施例中,查询与查询文本相关的素材资源集合,包括:查询对应的语义向量与查询文本的语义向量之间的相似度大于第二预设相似度阈值的素材资源;将查找到的素材资源确定为素材资源集合。在一些实施例中,根据素材资源序列生成视频,包括:将顺序连接素材资源序列中各图像和视频素材资源所得到的视频确定为第一视频;将顺序连接素材资源序列中各音频素材资源所得到的音频确定为第一音频;将第一视频和第一音频分别确定为所生成的视频中的视频和音频部分。在一些实施例中,根据素材资源序列生成视频,包括:查询对应的语义向量与查询文本的语义向量之间的相似度大于第二预设相似度阈值的文本查询结果;基于查找到的文本查询结果确定文本查询结果摘要;利用语音合成技术,生成与文本查询结果摘要对应的语音作为第二音频;顺序连接素材资源序列中的各个图像和视频素材资源,得到第二视频;将第二音频和第二视频分别确定为所生成的视频中的音频和视频部分。在一些实施例中,该方法还包括:响应于接收到用于指示播放所生成的视频的播放请求,播放所生成的视频。第二方面,本申请实施例提供了一种用于生成视频的装置,该装置包括:接收单元,被配置成接收用户输入的查询文本;查询单元,被配置成查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;呈现单元,被配置成呈现素材资源集合;确定单元,被配置成响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;生成单元,被配置成根据素材资源序列生成视频。在一些实施例中,查询单元包括:分词模块,被配置成对查询文本进行分词,得到与查询文本对应的分词序列;第一查询模块,被配置成对于分词序列中的分词,查询与该分词的匹配度大于预设匹配度阈值的素材资源;第一确定模块,被配置成将查找到的素材资源确定为素材资源集合。在一些实施例中,第一查询模块进一步被配置成:查询对应的语义向量与该分词的词向量之间的相似度大于第一预设相似度阈值的素材资源。在一些实施例中,查询单元包括:第二查询模块,被配置成查询对应的语义向量与查询文本的语义向量之间的相似度大于第二预设相似度阈值的素材资源;第二确定模块,被配置成将查找到的素材资源确定为素材资源集合。在一些实施例中,生成单元包括:第三确定模块,被配置成将顺序连接素材资源序列中各图像和视频素材资源所得到的视频确定为第一视频;第四确定模块,被配置成将顺序连接素材资源序列中各音频素材资源所得到的音频确定为第一音频;第五确定模块,被配置成将第一视频和第一音频分别确定为所生成的视频中的视频和音频部分。在一些实施例中,生成单元包括:第三查询模块,被配置成查询对应的语义向量与查询文本的语义向量之间的相似度大于第二预设相似度阈值的文本查询结果;第六确定模块,被配置成基于查找到的文本查询结果确定文本查询结果摘要;语音合成模块,被配置成利用语音合成技术,生成与文本查询结果摘要对应的语音作为第二音频;连接模块,被配置成顺序连接素材资源序列中的各个图像和视频素材资源,得到第二视频;第七确定模块,被配置成将第二音频和第二视频分别确定为所生成的视频中的音频和视频部分。在一些实施例中,该装置还包括:播放单元,被配置成响应于接收到用于指示播放所生成的视频的播放请求,播放所生成的视频。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。第五方面,本申请实施例提供了另一种服务器,包括:接口;存储器,其上存储有一个或多个程序;以及一个或多个处理器,在操作上连接到上述接口和上述存储器,用于:接收用户输入的查询文本;查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;呈现素材资源集合;响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;根据素材资源序列生成视频。第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,当上述计算机程序被一个或多个处理器执行时,使得上述一个或多个处理器:接收用户输入的查询文本;查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;呈现素材资源集合;响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;根据素材资源序列生成视频。目前,用户在制作视频的过程中,往往需要人工拍摄或者制作生成视频所需的各种素材资源(包括视频、音频和图像),故而制作视频的成本较高(包括硬件成本、制作经验成本和时间成本等等)。本申请实施例提供的用于生成视频的方法和装置,通过首先接收用户输入的查询文本,再查询与查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频,而后呈现素材资源集合,接着接收用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列,最后根据素材资源序列生成视频,从而通过根据用户输入的查询文本,为用户提供素材资源,再基于用户对所提供的素材资源的选择和排序操作生成视频,降低了用户生成视频的成本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2A是根据本申请的用于生成视频的方法的一个实施例的流程图;图2B是根据本申请的步骤202的一个实施例的分解流程图;图2C是根据本申请的步骤202的又一个实施例的分解流程图;图2D是根据本申请的步骤205的一个实本文档来自技高网...

【技术保护点】
1.一种用于生成视频的方法,包括:/n接收用户输入的查询文本;/n查询与所述查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;/n呈现所述素材资源集合;/n响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;/n根据所述素材资源序列生成视频。/n

【技术特征摘要】
1.一种用于生成视频的方法,包括:
接收用户输入的查询文本;
查询与所述查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;
呈现所述素材资源集合;
响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排序操作,确定素材资源序列;
根据所述素材资源序列生成视频。


2.根据权利要求1所述的方法,其中,所述查询与所述查询文本相关的素材资源集合,包括:
对所述查询文本进行分词,得到与所述查询文本对应的分词序列;
对于所述分词序列中的分词,查询与该分词的匹配度大于预设匹配度阈值的素材资源;
将查找到的素材资源确定为素材资源集合。


3.根据权利要求2所述的方法,其中,所述查询与该分词的匹配度大于预设匹配度阈值的素材资源,包括:
查询对应的语义向量与该分词的词向量之间的相似度大于第一预设相似度阈值的素材资源。


4.根据权利要求1所述的方法,其中,所述查询与所述查询文本相关的素材资源集合,包括:
查询对应的语义向量与所述查询文本的语义向量之间的相似度大于第二预设相似度阈值的素材资源;
将查找到的素材资源确定为所述素材资源集合。


5.根据权利要求1所述的方法,其中,所述根据所述素材资源序列生成视频,包括:
将顺序连接所述素材资源序列中各图像和视频素材资源所得到的视频确定为第一视频;
将顺序连接所述素材资源序列中各音频素材资源所得到的音频确定为第一音频;
将所述第一视频和所述第一音频分别确定为所生成的视频中的视频和音频部分。


6.根据权利要求1所述的方法,其中,所述根据所述素材资源序列生成视频,包括:
查询对应的语义向量与所述查询文本的语义向量之间的相似度大于第二预设相似度阈值的文本查询结果;
基于查找到的文本查询结果确定文本查询结果摘要;
利用语音合成技术,生成与所述文本查询结果摘要对应的语音作为第二音频;
顺序连接所述素材资源序列中的各个图像和视频素材资源,得到第二视频;
将所述第二音频和所述第二视频分别确定为所生成的视频中的音频和视频部分。


7.根据权利要求1所述的方法,其中,所述方法还包括:
响应于接收到用于指示播放所生成的视频的播放请求,播放所生成的视频。


8.一种用于生成视频的装置,包括:
接收单元,被配置成接收用户输入的查询文本;
查询单元,被配置成查询与所述查询文本相关的素材资源集合,其中,素材资源为图像、视频或音频;
呈现单元,被配置成呈现所述素材资源集合;
确定单元,被配置成响应于接收到用户对所呈现的素材资源集合中素材资源的选择操作和排...

【专利技术属性】
技术研发人员:田浩卢大明陈曦王健宇
申请(专利权)人:百度美国有限责任公司百度时代网络技术北京有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利