一种根据图文信息自动生成小视频的方法技术

技术编号:33531311 阅读:15 留言:0更新日期:2022-05-19 02:02
本发明专利技术公开了一种根据图文信息自动生成小视频的方法,属于图文信息处理技术领域,目的在于解决现有图文信息生成小视频操作繁琐、智能化程度低的问题。其通过系统化的提取富文本中的图片和纯文本信息,并对纯文本信息进行NLP分词处理、NLP分段处理、音频转换处理,再基于文本关键词搜索图片集的图片,将图片集的图片与纯文本信息处理后的一段或多段文字进行组合再搭配背景模板后生成一张指定分辨率的图片,最终形成相同分辨率的有序的单帧图片集,再结合音频文件最终生成小视频,有效提升了图文信息生成小视频的处理效率,且智能化、自动化程度高。本发明专利技术适用于一种根据图文信息自动生成小视频的方法。自动生成小视频的方法。自动生成小视频的方法。

【技术实现步骤摘要】
一种根据图文信息自动生成小视频的方法


[0001]本专利技术属于图文信息处理
,具体涉及一种根据图文信息自动生成小视频的方法。

技术介绍

[0002]近年来,随着计算机视觉领域的飞速发展和生成对抗网络的提出,图像生成的研究受到了越来越广泛的关注,其在素材积累,数据集自动生成方面有非常积极的意义。视频相比于图像它更加生动,生成难度也更大,因此对于视频生成方面的探索更加有研究意义。
[0003]现阶段将图文信息生成小视频没有系统化的流程,操作过程十分繁琐,缺乏智能化的处理方法。如今随着小视频的流行,用户的阅读倾向逐渐从图文信息转化为观看小视频。因此迫切需要一种根据图文信息自动生成小视频的方法。

技术实现思路

[0004]本专利技术的目的在于提供一种根据图文信息自动生成小视频的方法,解决现有图文信息生成小视频操作繁琐、智能化程度低的问题。
[0005]本专利技术采用的技术方案如下:
[0006]一种根据图文信息自动生成小视频的方法,包括以下步骤:
[0007](1)进行富文本处理,提取富文本中的图片并添加到图片集,提取纯文本信息;
[0008](2)对纯文本信息进行处理,处理过程具体包括对以下步骤:
[0009](2.1)对纯文本信息进行NLP分词处理,提取纯文本信息中的人名、地名关键词,用于检索图片中的对应图片资源;
[0010](2.2)对纯文本信息进行NLP分段处理,将纯文本信息中段落较长的部分再次分段并进行缩句处理;
[0011](2.3)对纯文本信息进行音频转换处理,将纯文本信息的语句转换为音频信息并写入到音频文件;
[0012](3)根据NLP分词处理提取的关键词,对图片集进行搜索提取与关键词匹配的图片;
[0013](4)将步骤(3)中提取的图片与NLP分段处理后的一段或多段纯文本信息进行组合,搭配预设的背景模板生成一张指定分辨率的图片,合成单帧画面图片;
[0014](5)根据纯文本信息的段落顺序依次合成若干单帧画面图片,并根据纯文本信息的段落顺序进行排序,形成有序的单帧图片集;
[0015](6)指定单帧图片集中每张单帧画面图片的显示时长,然后将单帧图片集与步骤(2.3)中的音频文件结合动画模板及背景音乐,合成视频文件。
[0016]进一步地,所述步骤(2.3)中纯文本信息通过AI语音识别转成音频文件。
[0017]进一步地,所述步骤(6)中,背景音乐为纯音乐或歌曲。
[0018]进一步地,所述图片集的图片包括富文本中提取的图片和图片素材数据库中的图
片。
[0019]进一步地,所述富文本中提取的图片和图片素材数据库中的图片均通过图片内容进行关键词定义,关键词内容包括图片人物姓名、图片所处地点、图片物体名称。
[0020]综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
[0021]1、本专利技术中,通过系统化的提取富文本中的图片和纯文本信息,并对纯文本信息进行NLP分词处理、NLP分段处理、音频转换处理,再基于文本关键词搜索图片集的图片,将图片集的图片与纯文本信息处理后的一段或多段文字进行组合再搭配背景模板后生成一张指定分辨率的图片,最终形成相同分辨率的有序的单帧图片集,再结合音频文件最终生成小视频,有效提升了图文信息生成小视频的处理效率,且智能化、自动化程度高,有效解决了现有图文信息生成小视频操作繁琐、智能化程度低的问题。
附图说明
[0022]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
[0023]图1为本专利技术的流程示意图。
具体实施方式
[0024]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0025]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]一种根据图文信息自动生成小视频的方法,包括以下步骤:
[0027](1)进行富文本处理,提取富文本中的图片并添加到图片集,提取纯文本信息;
[0028](2)对纯文本信息进行处理,处理过程具体包括对以下步骤:
[0029](2.1)对纯文本信息进行NLP分词处理,提取纯文本信息中的人名、地名关键词,用于检索图片中的对应图片资源;
[0030](2.2)对纯文本信息进行NLP分段处理,将纯文本信息中段落较长的部分再次分段并进行缩句处理;
[0031](2.3)对纯文本信息进行音频转换处理,将纯文本信息的语句转换为音频信息并写入到音频文件;
[0032](3)根据NLP分词处理提取的关键词,对图片集进行搜索提取与关键词匹配的图片;
[0033](4)将步骤(3)中提取的图片与NLP分段处理后的一段或多段纯文本信息进行组
合,搭配预设的背景模板生成一张指定分辨率的图片,合成单帧画面图片;
[0034](5)根据纯文本信息的段落顺序依次合成若干单帧画面图片,并根据纯文本信息的段落顺序进行排序,形成有序的单帧图片集;
[0035](6)指定单帧图片集中每张单帧画面图片的显示时长,然后将单帧图片集与步骤(2.3)中的音频文件结合动画模板及背景音乐,合成视频文件。
[0036]进一步地,所述步骤(2.3)中纯文本信息通过AI语音识别转成音频文件。
[0037]进一步地,所述步骤(6)中,背景音乐为纯音乐或歌曲。
[0038]进一步地,所述图片集的图片包括富文本中提取的图片和图片素材数据库中的图片。
[0039]进一步地,所述富文本中提取的图片和图片素材数据库中的图片均通过图片内容进行关键词定义,关键词内容包括图片人物姓名、图片所处地点、图片物体名称。
[0040]本专利技术在实施过程中,通过系统化的提取富文本中的图片和纯文本信息,并对纯文本信息进行NLP分词处理、NLP分段处理、音频转换处理,再基于文本关键词搜索图片集的图片,将图片集的图片与纯文本信息处理后的一段或多段文字进行组合再搭配背景模板后生成一张指定分辨率的图片,最终形成相同分辨率的有序的单帧图片集,再结合音频文件最终生成小视频,有效提升了图文信息生成小视频的处理效率,且智能化、自动化程度高,有效解决了现有图文信息生成小视频操作繁琐、智能化程度低的问题。
[0041]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种根据图文信息自动生成小视频的方法,其特征在于,包括以下步骤:(1)进行富文本处理,提取富文本中的图片并添加到图片集,提取纯文本信息;(2)对纯文本信息进行处理,处理过程具体包括对以下步骤:(2.1)对纯文本信息进行NLP分词处理,提取纯文本信息中的人名、地名关键词,用于检索图片中的对应图片资源;(2.2)对纯文本信息进行NLP分段处理,将纯文本信息中段落较长的部分再次分段并进行缩句处理;(2.3)对纯文本信息进行音频转换处理,将纯文本信息的语句转换为音频信息并写入到音频文件;(3)根据NLP分词处理提取的关键词,对图片集进行搜索提取与关键词匹配的图片;(4)将步骤(3)中提取的图片与NLP分段处理后的一段或多段纯文本信息进行组合,搭配预设的背景模板生成一张指定分辨率的图片,合成单帧画面图片;(5)根据纯文本信息的段落顺序依次合成若干单帧画面图片,并根据纯文本信息...

【专利技术属性】
技术研发人员:赖贵全田孟军
申请(专利权)人:成都易达数安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1