The invention provides a video generation method, a storage medium and a device, which comprises steps 11: selecting at least one picture to be analyzed to determine the sequence of the pictures to be analyzed; step 13: identifying and extracting the text information in each picture to be analyzed, or inputting the text information of each picture to be analyzed, and performing steps 14 and 15, respectively; The text information of the picture is converted into audio data; Step 15: Input the picture to be analyzed and its text information into the generative countermeasure network to generate the corresponding sub-video of each picture to be analyzed; Step 17: According to the order of the pictures to be analyzed, the audio data and sub-video of each picture to be analyzed are synthesized into the corresponding video of all the pictures to be analyzed. Based on the method of the invention, the corresponding video can be generated based on single or multiple pictures, the user experience can be improved, and the cost of video production can be reduced.
【技术实现步骤摘要】
视频生成方法、存储介质和装置
本专利技术涉及计算机领域,特别涉及一种视频生成方法、存储介质和装置。
技术介绍
相比文字、语音和图片,视频是一种更好的呈现方式,但视频制作依赖人力,成本较高。现存的大量的静态图片,例如绘本,都需要更佳的视频呈现方法。如何将静态图片自动生成视频,是目前急需解决的技术问题。
技术实现思路
有鉴于此,本专利技术提供一种视频生成方法、存储介质和装置,以解决如何基于图片自动生成视频的问题。本专利技术提供一种视频生成方法,该方法包括:步骤11:选定至少一张待分析图片,确定待分析图片的先后次序;步骤13:识别并提取每张待分析图片中的文字信息,或输入每张待分析图片的文字信息,分别执行步骤14和步骤15;步骤14:将每张待分析图片的文字信息转换为音频数据;步骤15:将待分析图片及其文字信息输入生成式对抗网络,生成每张待分析图片对应的子视频;步骤17:根据待分析图片的次序,将每张待分析图片的音频数据和子视频合成为所有待分析图片对应的视频。本专利技术还提供一种非瞬时计算机可读存储介质,非瞬时计算机可读存储介质存储指令,指令在由处理器执行时使得处理器执行本专利技术上述的视频生成方法中的步骤。本专利技术还提供一种视频生成装置,包括处理器和上述的非瞬时计算机可读存储介质。本专利技术使用对抗式生成网络将静态图片生成连续性的视频,本专利技术设计生成式对抗网络的输入不仅包括图片,还包括该图片相关的文字信息,使生成式对抗网络可以更好地输出该图片相关的子视频,进而确保本专利技术的视频生成方法可以产生真正的视频。附图说明图1为本专利技术视频生成方法的流程图;图2为本专利 ...
【技术保护点】
1.一种视频生成方法,其特征在于,所述方法包括:步骤11:选定至少一张待分析图片,确定所述待分析图片的先后次序;步骤13:识别并提取每张待分析图片中的文字信息,或输入每张待分析图片的文字信息,分别执行步骤14和步骤15;步骤14:将每张待分析图片的文字信息转换为音频数据;步骤15:将待分析图片及其文字信息输入生成式对抗网络,生成每张待分析图片对应的子视频;步骤17:根据所述待分析图片的次序,将每张待分析图片的音频数据和子视频合成为所有待分析图片对应的视频。
【技术特征摘要】
1.一种视频生成方法,其特征在于,所述方法包括:步骤11:选定至少一张待分析图片,确定所述待分析图片的先后次序;步骤13:识别并提取每张待分析图片中的文字信息,或输入每张待分析图片的文字信息,分别执行步骤14和步骤15;步骤14:将每张待分析图片的文字信息转换为音频数据;步骤15:将待分析图片及其文字信息输入生成式对抗网络,生成每张待分析图片对应的子视频;步骤17:根据所述待分析图片的次序,将每张待分析图片的音频数据和子视频合成为所有待分析图片对应的视频。2.根据权利要求1所述的方法,其特征在于,在所述步骤14和步骤15之后,以及所述步骤17之前还包括:步骤16:比较每张待分析图片的音频数据的时长与其子视频的时长是否相同,如果不同,通过调整所述待分析图片的子视频的时长和/或调整其音频数据的时长使两者的时长相同。3.根据权利要求1所述的方法,其特征在于,步骤13中,所述识别并提取每张待分析图片中的文字信息包括:基于CNN+BLSTM+CTC模型识别并提取每张待分析...
【专利技术属性】
技术研发人员:谢攀,赖长铃,何健,柳瑞超,杨建军,杜玉强,
申请(专利权)人:三星电子中国研发中心,三星电子株式会社,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。